Подписаться
Опубликовано

Обрабатываем строки в 109 раз быстрее, чем H100

Автор
  • Имя
    Новости нашего ИТ
    Telegram

Обрабатываем строки в 109 раз быстрее, чем Nvidia на H100 #java Недавно я выпустил StringZilla v4 — первый релиз с поддержкой CUDA моей библиотеки для обработки строк. нацеленной в первую очередь на SIMD. Это означает, что теперь она стала быстрой не только на CPU, но и на GPU! • Я хотел добавить ускорение ROCm для GPU AMD • Я хотел добавить параллельный мультипаттерновый алгоритм поиска • Я хотел опубликовать всё это ещё в декабре 2024 года Итак, не всё пошло по плану, но StringZilla 4 CUDA наконец-то здесь, и она добавляет 500 с лишним GigaCUPS вычислений редакторского расстояния; при этом пакет можно установить через pip install. Также в ней есть некоторые другие трюки, предназначенные для крупномасштабных систем извлечения данных, баз данных и озёр данных, а также биоинформационных задач. И всё это под разрешительной опенсорсной лицензией Apache 2.

link

Новости нашего ИТ
14 подписчиков
5145 постов
Данный канал является агрегатором технических статей нашего любимого ИТ, так что кто устал листать тысячи сайтов в поиске технических статей присоеденяйтесь к каналу и наслаждайтесь #it_news

Свежие посты