Поддержать нас
Беларусы на войне
  1. «Меньше кофе надо было пить, не напьетесь вы этого кофе вечно». Беларуску оставил на заправке рейсовый автобус — кто прав
  2. «В Минске зарплаты по 3000? Нет, вот вам реалии». Беларуска показала расчетник водителя госпредприятия за май и удивила Threads
  3. Беларусь получила щедрый «подарок» из-за границы — его масштабы впечатляют. Но такие «презенты» несут риски для нашей страны
  4. Беларуска назвала свою пенсию после 37 лет работы и попросила других поделиться цифрами. Суммы заметно отличаются
  5. На авторынке «умирает» один из дилеров
  6. Возле Дроздов в Минске есть секретная многоэтажка — информации о ней минимум. Но всплыли данные об одной из квартир
  7. «Мы отрежем Крым от России». Командующий Силами беспилотных систем Украины Бровди о стратегии ударов
  8. Власти продали арестованную квартиру известного экономиста по нетипичной схеме
  9. Без Трампа, но с крупной победой. Сборная США ярко стартовала на домашнем чемпионате мира
  10. Пропагандист заявил, что 196 политзаключенных, об освобождении которых ранее не было известно, уже на свободе
  11. Можно ли внезапно умереть от испуга, плохих новостей или сильного стресса — рассказываем
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.