Категория:Трансформер (модель машинного обучения)

Материал из Викиновостей, свободного источника новостей
Трансфо́рмер (англ. Transformer) — архитектура глубоких нейронных сетей, представленная в 2017 году исследователями из Google Brain. По аналогии с рекуррентными нейронными сетями (РНС) трансформеры предназначены для обработки последовательностей, таких как текст на естественном языке, и решения таких задач как машинный перевод и автоматическое реферирование. В отличие от РНС, трансформеры не требуют обработки последовательностей по порядку. Например, если входные данные — это текст, то трансформеру не требуется обрабатывать конец текста после обработки его начала. Благодаря этому трансформеры распараллеливаются легче чем РНС и могут быть быстрее обучены.
 

Подкатегории

Эта категория содержит только следующую подкатегорию.

Страницы в категории «Трансформер (модель машинного обучения)»

Эта категория содержит единственную страницу.