Обладая огромным потенциалом, технологии на основе искусственного интеллекта проникают практически во все сферы жизни, а в некоторых совершают настоящую революцию.
Мечты об устройствах, дающих своим владельцам суперспособности, уже не кажутся такими несбыточными. Будущее наступило, и оно открывает новые возможности уже сегодня. Как ИИ поможет аудиологии, и чего ждать от него людям с нарушениями слуха?
Ответы на вопросы в материале аудиолога Николая Пудова.
Искусственный интеллект (ИИ) продолжает проникать в различные сферы человеческой жизни, и медицина не является исключением. В последнее десятилетие ИИ пережил настоящую революцию, став мощным инструментом для диагностики, лечения и исследований в области здравоохранения.
В последние годы в разных сферах, в том числе и в аудиологии, нейронные сети получают все большее признание благодаря своим выдающимся возможностям в распознавании звуков, классификации данных и улучшении качества звукопередачи.
Данные, полученные в результате множества различных аудиологических тестов и процедур, легко поддаются количественной оценке, что делает аудиологию наиболее подходящей областью для внедрения современных методов машинного обучения. Со временем алгоритмы искусственного интеллекта могут взять на себя задачи, которые сейчас выполняются людьми, или задачи, которые в настоящее время не выполняются из-за нехватки ресурсов, времени или клинических последствий, включая скрининг наиболее легких форм нарушений слуха.
Применение ИИ в аудиологии многогранно, и одним из его наиболее заметных достижений является дифференциальная диагностика потери слуха. Традиционные методы обнаружения потери слуха часто полагаются на субъективные оценки, которые могут привести к существенным неточностям. Тем не менее алгоритмы ИИ могут анализировать огромные объемы данных из аудиологических тестов, что позволяет проводить более точные и объективные диагнозы. Это помогает не только определить степень потери слуха, но и определить ее тип, уровень поражения, потенциальные причины и своевременно наметить методы преодоления тугоухости.
Роль искусственного интеллекта в аудиологии выходит за рамки диагностики и лечения тугоухости. Он также используется для прогнозирования будущей потери слуха. Алгоритмы машинного обучения могут анализировать генетические данные человека, факторы образа жизни и воздействие шума, чтобы предсказать риск развития потери слуха. Эта прогностическая способность значительно расширит возможности стратегии раннего вмешательства и профилактики тугоухости, потенциально снижая распространенность потери слуха как среди детей, так и среди взрослого населения.
Технологии искусственного интеллекта могут сыграть важную роль в преодолении барьеров общения глухих или слабослышащих людей с другими людьми, внося значительный вклад в их социальную интеграцию. Недавние достижения в технологиях и в алгоритмах искусственного интеллекта проложили путь для разработки различных устройств, технологий и приложений, направленных на удовлетворение потребностей глухих и слабослышащих людей.
AR-очки c субтитрами
Большинству людей с кохлеарными имплантами и слуховыми аппаратами трудно общаться в социальных ситуациях в шумной обстановке (на улице, деловой встрече, на рабочем месте). Разве не было бы замечательно, если бы реальная жизнь сопровождалась субтитрами, чтобы люди с нарушением слуха могли видеть расшифровку разговоров в режиме реального времени прямо у себя на глазах? В современном мире везде есть автоматические субтитры. Мы видим их на платформах социальных сетей и сервисах видеосвязи. Субтитры могут иметь огромное значение для людей с потерей слуха, которые хотят следить за телешоу или понимать видеовызов. Что ж, это уже не футуристическая идея, а то, что стало возможным благодаря очкам дополненной реальности (AR) и технологиям искусственного интеллекта, которые переводят речь в текст даже в шумной обстановке.
Очки с живыми субтитрами используют технологию дополненной реальности для проецирования на устройство сервиса субтитров. Они могут помочь людям с проблемами слуха в повседневном общении, а это означает, что больше не нужно полагаться на чтение речи с губ, чтобы заполнить любые недостающие ключевые слова в разговоре с собеседником, а можно наслаждаться общением с относительной легкостью.
Вы просто надеваете очки для субтитров и можете «увидеть» преобразование, происходящее в поле вашего зрения, — точно так же, как смотрите телевизор с субтитрами.
Очки для субтитров существуют уже несколько лет, но первоначальные прототипы были большими, и их было неудобно носить в течение длительного времени. Сегодня они становятся все более легкими, а некоторые, помимо непосредственно субтитров, даже могут похвастаться новыми инновационными функциями. Это означает, что их можно применять в различных ситуациях: во время разговоров, в кино, театре, на лекции, на встречах или дома при просмотре телевизора.
Искусственный интеллект и чтение с губ
Одним из способов общения глухих людей является чтение речи с губ и лица говорящего. Чтение по губам — это способ понимания речи путем интерпретации движения губ человека. И, на первый взгляд, можно предположить, что научиться чтению с губ довольно легко. Но это не так! Человеческая речь очень сложна и тонка: одно и то же движение губ может соответствовать разным фонемам (основным единицам звука). Поэтому на практике при чтении с губ часто встречаются затруднения и ошибки, которые могут привести к неправильному пониманию высказывания.
Обзор научной литературы показал, что большинство людей могут читать по губам только с точностью 20–50%. Хорошо обученный человек, читающий речь, может «видеть» только 4–5 слов в предложении из 12 слов. Основная цель чтения по губам — понять смысл речи, а не понять каждое отдельное слово. При этом чтение по губам требует от человека большой концентрации внимания.
Ученые создали систему искусственного интеллекта под названием LipNet, которая может точно читать по губам. Искусственный интеллект при «чтении» речи с губ достигает точности до 80%, а при работе с целыми предложениями до 94%. Точность системы впечатляет, но она все еще неидеальна. Тем не менее технология действительно многообещающая и с успехом может быть использована для слабослышащих и глухих людей при общении со слышащими.
Искусственный интеллект и жестовая (дактильная) речь
Язык жестов является основным средством общения слабослышащих и глухих людей во всем мире. Он является самостоятельным языком, состоящим из различных жестов, каждый из которых производится руками в сочетании с мимикой и движениями тела человека. Совокупность этих жестов позволяет образовывать различные высказывания, передающие смысл отдельных слов и предложений.
Сурдопереводчики помогают решить проблему общения людей с нарушениями слуха в обществе слышащих людей, переводя язык жестов в устную речь и наоборот. Однако проблема заключается в недостаточном количестве опытных переводчиков жестового языка во всем мире.
В настоящее время для распознавания языка жестов используются носимые сенсорные средства, такие как сенсорные перчатки, или применяется обработка видеоизображений. В перчатках установлены механические или оптические датчики, которые и преобразуют движения пальцев в электрические сигналы для определения положения руки для распознавания. При подходе, основанном на обработке видеоизображений, нейросеть с помощью прогрессивных алгоритмов распознает на видео положение ладоней и пальцев рук и переводит их в текстовую информацию.
Несмотря на прогресс в исследованиях и значительные достижения, достигнутые в области интеллектуальных систем распознавания языка жестов, в этом направлении существует большой потенциал для развития.
Слуховые аппараты
В последние годы с развитием искусственного интеллекта тема программирования слуховых аппаратов привлекает особое внимание научного сообщества. Сочетание передовых технологий ИИ с медицинской наукой открывает новые перспективы для улучшения качества жизни людей с потерей слуха.
Одна из основных проблем в программировании слухового аппарата — это поиск оптимальной комбинации параметров для каждого конкретного случая. Каждый пользователь имеет свою индивидуальную потерю слуха и свои индивидуальные предпочтения восприятия звуков. Здесь ИИ как нельзя кстати приходит на помощь. Слуховые аппараты и речевые процессоры уже используют для обработки звука искусственный интеллект. Например, некоторые устройства могут автоматически корректировать свои настройки в соответствии с текущей акустической обстановкой, в которой находится пользователь (например, в закрытом помещении, в концертном зале или на улице), используя либо предварительно обученные глубокие нейронные сети (Deep Neural Network (DNN)), либо активное обучение с помощью Гауссовских процессов для отслеживания предпочтений каждого отдельного пользователя с течением времени.
Передовые технологии искусственного интеллекта позволили современным слуховым аппаратам слушать, учиться и адаптироваться к звуковой среде в режиме реального времени. Они больше не полагаются на фиксированные настройки — слуховые аппараты на базе искусственного интеллекта могут анализировать миллионы звуков и корректировать микронастройки, чтобы обеспечить персонализированный опыт прослушивания каждому пользователю. Этот революционный сдвиг позволяет улучшить четкость речи даже в шумной или любой сложной акустической обстановке. Некоторые модели слуховых аппаратов, представленные в настоящее время на рынке, имеют также дополнительные функции отслеживания состояния здоровья, что помогает контролировать основные показатели и предотвратить риск развития сопутствующих заболеваний.
Алгоритмы машинного обучения позволяют провести более глубокий анализ звукового окружения. С помощью больших объемов данных, собранных от пользователей слуховых аппаратов, ИИ способен обучиться распознавать и классифицировать различные типы звуков: речь, шумы окружающей среды или музыку. Это позволяет слуховому аппарату автоматически настраиваться на конкретное звуковое окружение пользователя.
Шум является одной из основных проблем при использовании слуховых аппаратов. Однако благодаря возможностям ИИ можно значительно улучшить эффективность шумоподавления. Алгоритмы искусственного интеллекта способны распознавать и различать различные типы шумов. С помощью этой информации слуховой аппарат динамически подстраивается под изменяющиеся условия окружающей среды и активирует соответствующий алгоритм шумоподавления. Это позволяет пользователям слуховых аппаратов наслаждаться более чистым и качественным звуком даже в сложных акустических условиях.
Кохлеарные импланты
Речевые процессоры системы кохлеарной имплантации (КИ) имеют множество настраиваемых параметров, что дает сотни возможных вариантов для их настройки. Результаты настройки индивидуальны для каждого пациента даже в пределах относительно однородной группы реципиентов.
Как специалист с большим опытом работы в настройке речевых процессоров хочу отметить, что настройка речевого процессора системы кохлеарной имплантации часто основана на комфорте пользователя, а не на жестких показателях. Поэтому неудивительно, что не существует стандартизированного подхода к настройке речевого процессора КИ. Многие продвинутые аудиологи на протяжении многих лет разрабатывают свои собственные эвристические подходы, основанные на личном опыте. Применение искусственного интеллекта в настройке параметров речевого процессора позволит автоматизировать процесс настройки КИ с учетом накопленного опыта. На данный момент ведутся разработки в систематизации и стандартизации методов настройки. Следует признать, что искусственный интеллект окажет неоценимую помощь в этом направлении.
Научные исследование в области аудиологии
Использование искусственного интеллекта в медицинских исследованиях принесло огромные преимущества. Алгоритмы ИИ способны анализировать большое количество научных статей и практических результатов, выявлять паттерны и предоставлять новые направления для дальнейших исследований. Это значительно сокращает время, необходимое для разработки новых лекарственных препаратов и медицинских технологий. Кроме того, ИИ может ускорить процесс клинических испытаний, оптимизировать протоколы и помочь в поиске подходящих участников. В результате этого новые лекарства и методы лечения могут быть быстрее внедрены в практику.
Таким образом, использование ИИ в медицинских исследованиях не только повышает эффективность работы ученых, но также способствует более быстрой разработке новых лекарственных препаратов и новых методов лечения.
Заключение
Искусственный интеллект совершает революцию в области аудиологии, улучшая диагностику, лечение и исследования в области здравоохранения. Алгоритмы искусственного интеллекта могут анализировать большие объемы данных аудиологических тестов, что приводит к быстрой постановке точного диагноза. Нейронная сеть способна предсказать будущую потерю слуха, анализируя генетические данные и факторы образа жизни. Искусственный интеллект используется в различных устройствах для людей с нарушениями слуха, а также при программировании современных слуховых аппаратов для улучшения четкости речи. Более того, искусственный интеллект может автоматизировать процесс настройки кохлеарных имплантатов и помочь в медицинских исследованиях, анализируя научные статьи и предлагая новые направления для дальнейших исследований.
Искусственный интеллект обладает значительным потенциалом для улучшения диагностики и лечения нарушений слуха.