О разработке российскими учеными способ повышения точности устройств для отслеживания движения глаз
В последние годы технология айтрекинга - отслеживания направления взгляда - перестала быть исключительно лабораторным инструментом. Сегодня ее активно применяют в маркетинге, психологии, пользовательском тестировании интерфейсов и даже в киберспорте.
Главная проблема айтрекеров кроется в их устройстве. Камера ловит отсвет инфракрасного излучателя на зрачке (ИК-блик). В обычных условиях это работает хорошо, но в «сложных» - например, на человека в очках падает яркий потоколочный свет - появляются ложные засветки и отражения, которые сбивают алгоритм с толку.
Российские исследователи решили эту проблему кардинально: во-первых, алгоритм делает два снимка подряд: один с «темным» зрачком и один со «светлым» (за счет управления мощностью ИК-подсветки). Вычитая одно изображение из другого, система гасит статичные помехи (блики от очков, яркий свет) и оставляет только зрачок - «чистый сигнал»; во-вторых, включение классического алгоритма машинного обучения - кластеризация методом K-средних. Он мгновенно разбивает обработанное изображение на категории: вот зрачок, вот оставшиеся артефакты, а вот фон. Это позволяет отделить зерна от плевел и рассчитать взгляд с рекордной точностью в 16 пикселей, что вдвое точнее прежних решений.
Эффективность метода подтверждена экспериментально. Во время тестов точность определения зрачка у людей в очках выросла на впечатляющие 64%, а при ярком верхнем освещении - на 27%. В итоге общая точность айтрекера повысилась почти вдвое. Это означает, что устройство перестает капризничать при малейшем изменении условий, переходя в категорию надежного промышленного и бытового инструмента.
Благодаря этой разработке айтрекинг может выйти на новый уровень в таких ключевых областях как медицина и неврология; образование и функциональная диагностика; цифровые интерфейсы (UX/UI) и киберспорт.
«Таким образом, ученым удалось сделать то, чего так долго ждало мировое инженерное сообщество: превратить айтрекинг из капризной лабораторной игрушки в технологию, готовую к массовому и надежному применению. Устранение главного визуального шума программными методами открывает буквально второе дыхание для целой индустрии человеко-машинного взаимодействия. И это весомый повод для гордости за российскую компьютерную науку» - комментирует эксперт Ставропольского филиала Президентской академии Александр Калашников.