
Meta оголосила збір аудіозаписів і транскрипцій з малопоширених мов для покращення навчання ШІ
Meta оголосила збір аудіозаписів і транскрипцій з малопоширених мов для покращення навчання ШІ


Компанія Meta в партнерстві з ЮНЕСКО запускає програму зі збору аудіозаписів та їхніх транскрипцій різними мовами для навчання моделей, які в підсумку будуть загальнодоступними. Про це повідомляє TechCrunch.
У межах програми Meta шукає партнерів, які можуть надати понад 10 годин записів мови з транскрипціями, великі обсяги письмових текстів (понад 200 речень) та набори перекладених речень різними мовами, особливо рідкісними.
Партнери працюватимуть з командами компанії, щоб інтегрувати ці мови в моделі розпізнавання мовлення та перекладу штучного інтелекту. У підсумку, ШІ-моделі будуть відкритими для всіх.
Серед партнерів наразі уряд Нунавуту, малонаселеної території півночі Канади. Деякі жителі Нунавуту розмовляють інтуїтними мовами, відомими під загальною назвою інуктут.
Щоб приєднатися до проєкту, потрібно заповнити форму за посиланням.
Також Meta випустила еталонний тест для перевірки якості машинного перекладу. Тест, викладений на платформі з роброки ШІ Hugging Face, підтримує сім мов.
Meta позиціює обидві ініціативи як благодійні, але вона отримає вигоду від вдосконалення моделей розпізнавання мовлення та перекладу, зазначило медіа.
Фото: howtogeek.com