Исследование, опубликованное 11 июня UC Davis Health, знаменует собой значительный прогресс по сравнению с предыдущими технологиями, которые в основном ограничивались переводом сигналов мозга в текст. Новая система восстановила уровень общения, который раньше считался невозможным для 45-летнего добровольца с боковым амиотрофическим склерозом (БАС) - нейродегенеративным заболеванием, лишившим его голоса.
Нейропротез "мозг-голос" работает путем декодирования намерения мозга говорить. Исследователи имплантировали 256 микроэлектродов в область мозга пациента, отвечающую за управление речевыми мышцами. Когда человек пытается заговорить, BCI перехватывает эти сигналы и с помощью продвинутой модели искусственного интеллекта преобразует их в слышимую речь всего за 25 миллисекунд.
Исследователи использовали передовые алгоритмы ИИ, чтобы перевести активность мозга в синтезированную речь в режиме реального времени. Система обучалась на основе нейронных записей, сделанных в то время, когда участник пытался читать предложения, отображаемые на экране. Совместив паттерны срабатывания сотен нейронов с предполагаемыми звуками речи, алгоритм научился точно реконструировать голос участника прямо из сигналов его мозга.
BCI не просто воспроизводит монотонные слова; он успешно улавливает и воспроизводит вокальные интонации - тонкие изменения высоты тона и тембра, которые являются основой того, как люди передают смысл и эмоции. В ходе серии впечатляющих демонстраций пациент смог:
- Задавать вопросы, генерируя повышающуюся интонацию в конце предложения.
- Подчеркивать определенные слова, чтобы полностью изменить смысл предложения, например, подчеркивать разные слова во фразе: Я никогда не говорил, что она украла мои деньги.
- Пойте простые мелодии в 3 тона, демонстрируя тонкий уровень нейронного контроля над синтезированным голосом.
Чтобы сделать прорыв еще более глубоким, исследователи использовали искусственный интеллект для клонирования голоса, обученный на старых записях пациента, сделанных до его заболевания. В результате синтезированный голос звучал как его собственный, и, по словам пациента, "я чувствовал себя счастливым, и мне казалось, что это мой настоящий голос"
Хотя эта технология представляет собой большой прорыв, исследователи предупреждают, что она все еще является пробным вариантом. В тестах, где слушатели расшифровывали сигналы BCI, они правильно понимали слова пациента примерно в 56% случаев. Потребуются дальнейшие разработки, чтобы повысить его эффективность.