Недавно Google и компания Илона Маска xAI представили новые ИИ-генераторы изображений Imagen 3 и Grok 2 соответственно. Они подогревают еще больший интерес к подобным сервисам и хотят составить конкуренцию ведущим моделям MidJourney, Flux, Leonardo и Ideogram. Дипфейки сейчас заполнили сеть, особенно на тему политики. И Дональд Трамп, который вроде бы называет ИИ опасным, с радостью постит фейковые изображения в своих соцсетях. Так, на днях кандидат в президенты выставил на платформе Truth Social фото с якобы певицей Тейлор Свифт (Taylor Swift) и ее фанатами, на которых девушки призывают голосовать за Трампа («Swifties for Trump»). Политик подписал дипфейки «Я согласен!».
Затем в интервью Fox Business он признался: «Я ничего о них не знаю, кроме того, что их сгенерировал кто-то другой». Как говорится, на войне все средства хороши.
Но, несмотря на ажиотаж вокруг генераторов изображений в секторе ИИ, технология используется не только для преобразования текста в картинку и создания многочисленных дипфейков. Модель Health Acoustic Representations (HeAR) от Google помогает исследователям из Индии выявлять опасные болезни с помощью аудиоанализа, а именно по звуку кашля. Компания Salcit Technologies, занимающаяся респираторными заболеваниями, использует HeAR в работе как часть своего приложения Swaasa.
Команда специалистов Google обучила HeAR на 300 миллионах фрагментов аудиоданных, отобранных из разнообразного материала, идентифицировать примерно 100 миллионов звуков кашля. Например, ИИ-модель может определить конкретные респираторные заболевания, включая туберкулез и хроническую обструктивную болезнь легких.
По словам технического директора Google Health Шравья Шетти (Shravya Shetty), туберкулез – это излечимое заболевание, но проблема в том, что у многих людей нет простого доступа к медицинских услугам. «ИИ может сыграть важную роль в улучшении диагностики и последующем лечении», — подчеркнул Шетти.
Кроме того, с помощью HeAR можно выявить потенциальные проблемы со здоровьем (например, деменцию) по тону, высоте голоса и темпу речи.
За время активного развития генеративного ИИ на рынке появилась не только модель HeAR. Ученые из Кембриджского университета недавно выпустили ИИ-сервис EMethylNET , который способен обнаруживать рак на ранних стадиях, диагностировать его и составлять план лечения. Нью-йоркская компания Ezra использует ИИ для сканирования жизненно важных областей тела, в том числе мозга, чтобы тоже была возможность выявить заболевание на ранних стадиях. У британского стартапа Twinn Health есть ИИ-платформа, предназначенная для анализа снимков МРТ.
Возможно, в развитие ИИ на благо медицины и других важных сфер вкладывается не так много средств, как в генераторы контента, но все равно эта технология привносит свои плюсы и двигает прогресс.