The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Обновление открытого аудиокодека Lyra 1.3

12.11.2022 16:59

Компания Google опубликовала выпуск аудиокодека Lyra 1.3, нацеленного достижение высокого качества передачи голоса в условиях ограниченного объёма передаваемой информации. Качество речи на битрейтах 3.2 kbps, 6 kbps и 9.2 kbps при использовании кодека Lyra примерно соответствует битрейтам 10 kbps, 13 kbps и 14 kbps при использовании кодека Opus. Для решения поставленной задачи помимо обычных методов сжатия звука и преобразования сигналов, в Lyra применяется речевая модель на базе системы машинного обучения, позволяющая воссоздать недостающую информацию на основе типовых характеристик речи. Эталонная реализация кода написана на C++ и распространяется под лицензией Apache 2.0.

В отличие от предложенного в октябре кардинально переработанного выпуска Lyra 1.2, переведённого на новую архитектуру нейронной сети, в версии 1.3 проведена оптимизация модели машинного обучения без архитектурных изменений. В новой версии для хранения весов и выполнения арифметических операций вместо 32-разрядных чисел с плавающей запятой задействованы 8-разрядные целые числа, что привело к сокращению размера модели на 43% и ускорению работы с моделью на 20% при тестировании на смартфоне Pixel 6 Pro. Качество речи при этом удалось сохранить на том же уровне, но формат передаваемых данных изменился и не совместим с прошлыми выпусками.

  1. Главная ссылка к новости (https://github.com/google/lyra...)
  2. OpenNews: Google опубликовал открытый аудиокодек Lyra V2
  3. OpenNews: Компания Google открыла недостающие исходные тексты для аудиокодека Lyra
  4. OpenNews: Опубликован свободный звуковой кодек FLAC 1.4
  5. OpenNews: Предпринята попытка создания патентного пула для свободного звукового кодека Opus
  6. OpenNews: Facebook опубликовал звуковой кодек EnCodec, использующий машинное обучение
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/58100-lyra
Ключевые слова: lyra, audio
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (42) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.3, Аноним (3), 17:44, 12/11/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +5 +/
    > воссоздать недостающую информацию

    Скажешь "книга" на созвоне, а потом тебя в расисты запишут

     
     
  • 2.4, Аноним (4), 17:57, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +9 +/
    Мы готовы пойти на этот риск.
     
     
  • 3.5, Аноним (5), 18:14, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • –3 +/
    > Мы готовы пойти на этот риск.

    Вы -- расисты? Сегодня вроде быстрый гигабитный интернет у каждого в кармане, неужели они там на западе не могут купить у китайцев нормальных вышек мобильного интернета?

     
     
  • 4.7, Аноним (7), 18:51, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >  Сегодня вроде быстрый гигабитный интернет у каждого в кармане

    Хорошая шутка.

     
     
  • 5.8, Аноним (5), 19:00, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • –1 +/
    С тех пор, как 10 гигабитный проводной интернет стал доступен, не такой быстрый, конечно, и есть определённые оговорки как вроде в бункере работать хорошо не будет.
     
     
  • 6.12, Самый Лучший Гусь (?), 19:40, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +3 +/
    В бухгалтерии что-то перепутали и Лупа получил 10 гигабитный интернет, а дорогие россияне ростелеком.
     
     
  • 7.14, Аноним (5), 19:50, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +/
    У ростелекома разве только GPON?
     
  • 6.20, YetAnotherOnanym (ok), 20:50, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    10 гигабит до свича - хороший повод брать с нелоха в два раза больше, чем с нелоха, у которого только 1 гигабит до свича, и который, в свою очередь, платит тоже всего лишь в два раза больше, чем обычный лох на стомегабитном тарифе.
     
     
  • 7.21, Аноним (5), 21:03, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +/
    А у свича сколько гигабит? Нет, я, конечно, слышал, что не везде в мире есть привычные россиянам скорости интернета. А насчёт стоимости, ты предлагаешь платить около 10 USD за 10 гигабит, я правильно понимаю? Это обходится несколько подороже + стоимость оборудования, это не езернет. Некоторые провайдеры конечно ещё агрессивно шейпят трафик и режут скорости, но приличные таким не занимаются.
     
     
  • 8.31, YetAnotherOnanym (ok), 09:04, 13/11/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Подозреваю, что скорость трафика они режут не потому, что злые и вредные, а пото... текст свёрнут, показать
     
  • 4.24, Аноним (24), 21:41, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • –4 +/
    Если это сэкономит траффик на халявном VPNе, то можно хоть в расисты, хоть в мизогинисты, хоть в боди-отрицательные, хоть в нефте-сторонники, хоть в LGBTQ-фобы, хоть в что-там-в-SJW-методичке-написано записаться - на самом деле я не расист, но что там неадекватные SJW подумают - глубоко по**й.
     
  • 2.15, Bdfybec (?), 20:03, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +/
    > Скажешь "книга"...

    Это мем какой-то? Не могу понять при чем тут "книга" и расисты.

     
     
  • 3.17, Аноним (17), 20:12, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Ну а ты попробуй произнести слово вслух
     
  • 3.18, Аноним (18), 20:13, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Книга-книга-книга! https://www.youtube.com/watch?v=_ng1ovEr46c
     
  • 3.33, Аноним (-), 16:52, 13/11/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >Это мем какой-то?

    Нет.

    >Не могу понять при чем тут "книга" и расисты.

    Слово Niger американцы произносят как "нига". А в русском слове "книга" первая буква произносится глухо т.е. иностранец первую букву вообще не услышит. Среди русской диаспоры в США не принято произностить слово "Майонез" так как оно созвучно с английскими словами: My own ass - "майоунэс". переводится, как "Моя личная задница", или "Задница находящаяся в личной собственности".

    В Бразилии не произносите слово "Сергей" там это слово переводится как "Я гей". Если вас зовут Сергей, говорите всем, что вас зовут Сержио или Серж.

     
  • 2.28, Аноним (28), 05:14, 13/11/2022 [^] [^^] [^^^] [ответить]  
  • +/
    А вот это интересный вопрос, они там нейросетку под каждый язык отдельно тренируют? А то ведь на самом деле звучание языков-то разное.
     
     
  • 3.32, koblin_ (?), 10:04, 13/11/2022 [^] [^^] [^^^] [ответить]  
  • +/
    всмысле под каждый? разве есть языки кроме английского?
     
  • 2.34, Владимир (??), 17:15, 13/11/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Когда то я играл на лире ... Одной рукой играл, другой компилировал ядро Линуса ...
     

  • 1.6, doorsfan (?), 18:17, 12/11/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +9 +/
    — Вы пойдете на Шаляпина?

    — Нет, мне Шаляпин не нравится. Фальшивит, картавит, тенорок какой-то слабенький...

    — Хм. А вы где его слышали?

    —  ̶Д̶а̶ ̶м̶н̶е̶ ̶н̶е̶д̶а̶в̶н̶о̶ ̶Р̶а̶б̶и̶н̶о̶в̶и̶ч̶ ̶н̶а̶п̶е̶л̶ ̶п̶о̶ ̶т̶е̶л̶е̶ф̶о̶н̶у̶.̶ скачал .lyra и послушал

     
     
  • 2.9, Аноним (4), 19:06, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Где можно почитать про *разметку*?
     
     
  • 3.10, Аноним (10), 19:15, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    в одних и тех же комментах разметка работает или не работает в зависимости от того, где их смотришь: в новости или в форуме.
     
     
  • 4.11, Аноним (4), 19:18, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Я вот заметил, что если сообщение становится "скрыто модератором", то если смотришь как новость, то тэги [b]начинают работать[/b]
     
     
  • 5.13, a_kusb (ok), 19:44, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Интересно, а другие теги? Особенно javascript?
     
  • 2.16, Bdfybec (?), 20:06, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • –2 +/
    Что-то у тебя с логикой не то. Анекдот вообще не в тему получился.
     

  • 1.19, Аноним (19), 20:49, 12/11/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    > формат передаваемых данных изменился и не совместим с прошлыми выпусками

    и часто так ломать будут?

     
  • 1.22, Аноним (22), 21:22, 12/11/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    > позволяющая воссоздать недостающую информацию на основе типовых характеристик речи

    Вот интересно, есть же разные речевые особенности. Например некоторые картавят. А некоторые южане хэкают вместо звука гэ. Т.е. в рамках одного языка уже бывает разница, приятная для одних групп, и неприятная для других. А если брать китайский, там еще важен тон звука. И наборы звуков между языками вообще весьма сильно отличаются. Они эту модель обучили универсально для всех языков? Каким образом?

     
     
  • 2.23, Аноним (19), 21:25, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +/
    > Каким образом?

    Есть у нефтяников шутка: 100% извлечение нефти путём выкапывания траншеи шириной 100 метров и глубиной 2 км... Это намёк на размер Искусственного Идиота.

     
     
  • 3.25, Аноним (24), 21:43, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Сейчас другие траншеи более востребованы.
     
     
  • 4.26, Аноним (19), 21:50, 12/11/2022 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Помнится, уже копали ров с крокодилами в 2014, там ещё Кролик поставил 20 метров забора...
     
  • 2.27, Аноним (-), 03:44, 13/11/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Есть универсальный набор, включающий эти все Врождённая категоризация звуков, к... большой текст свёрнут, показать
     

  • 1.29, Аноним (29), 06:26, 13/11/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Опять мышинное обучение где попало суют.
     
  • 1.30, Zampolit (ok), 08:52, 13/11/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Припоминается баг в МФУ какой-то фирмы, когда символы некорректно распознавались и подменялись другими
     
     
  • 2.35, Аноним (19), 18:08, 13/11/2022 [^] [^^] [^^^] [ответить]  
  • +/
    > МФУ какой-то фирмы

    на "X" начинается, на "x" кончается...

     
     
  • 3.36, Аноним (-), 18:25, 13/11/2022 [^] [^^] [^^^] [ответить]  
  • +/
    Хйюлит Пакард?
     
  • 3.52, Zampolit (ok), 17:37, 03/01/2023 [^] [^^] [^^^] [ответить]  
  • +/
    >> МФУ какой-то фирмы
    > на "X" начинается, на "x" кончается...

    А точно "Сканеры и копиры Xerox могут менять цифры в документах при копировании" https://habr.com/ru/post/189010/ !


     

  • 1.37, Аноним (37), 18:43, 13/11/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    > , но формат передаваемых данных изменился и не совместим с прошлыми выпусками.

    Данных передаваемых кому и куда? Вопрос, если что, риторрический.

     
  • 1.38, nebularia (ok), 18:55, 13/11/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • –2 +/
    https://www.cnx-software.com/2021/02/28/lyra-audio-codec-enables-3-kbps-bitrat

    https://en.wikipedia.org/wiki/Lyra_(codec)

    Нытики, блин. Сравните качество по битрейту с существующими форматами (по обеим ссылкам), потом нойте, что ML не туда применили.

     
     
  • 2.40, Ударник пятилетки (?), 21:24, 13/11/2022 [^] [^^] [^^^] [ответить]  
  • +10 +/
    > ML

    Вообще нужно запретить на законодательном уровне. Это не то направление, по которому должен двигаться прогресс. Лично я вижу в скором времени огромную катастрофу для многих людей, чей труд может стать невостребованным.

     
     
  • 3.43, Аноним (-), 01:46, 14/11/2022 [^] [^^] [^^^] [ответить]  
  • –4 +/
    Такое уже было в истории Промышленная Революция устроила такое Сначала она отн... большой текст свёрнут, показать
     
     
  • 4.48, Ударник пятилетки (?), 21:48, 14/11/2022 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Направление прогресса должно расширять круг востребованных профессий, а не сужать!
     
  • 3.44, Аноним (44), 11:19, 14/11/2022 [^] [^^] [^^^] [ответить]  
  • –6 +/
    Вонючих луддитов нужно отправлять в дурку. Вместо того, чтобы постоянно быть в курсе технологий, адаптирования их под себя и адаптирования к ним, они ноют про снижение прямого человеческого фактора в производственных процессах товаров и услуг и что бедненькие не смогут себе хлебушка купить. Тьфу.
     
  • 3.50, Kuromi (ok), 21:43, 15/11/2022 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Скайнет, Терминаторы и Сайлоны на подходе, да. Шутка, на самом деле просто 9Х% населения окажется "ненужно" и будет социальный ппц.
     

  • 1.41, Аноним (41), 23:56, 13/11/2022 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Часто в переписке читаю, гр@банное автодополнение. Прям вижу как все эти мудоскайпы и телемосты будут начинаться как в театре. "Просим говорить медленно, не есть и не употреблять воду во время совещания, отключить автодополение. Инструкция по отключению...“
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру