Распознавание голоса, почерка, речи и зрительной информации

Автор Alexy, июня 15, 2007, 14:28:07

« назад - далее »

Alexy

Какое из направлений компьютерного распознавания сейчас развивается наиболее успешно: идентификация личности по голосу, идентификации личности по почерку, распознавание речи или распознавание зрительной информации?


Очевидно идентификация по почерку и голосу? Или нет?

Комбинатор

Цитата: "Alexy"Какое из направлений компьютерного распознавания: голоса, почерка, речи или зрительной информации сейчас развивается наиболее успешно?

Очевидно почерка и голоса? Или нет?

Все направления развиваются, какое из них более успешно, сказать не берусь.
Кстати, какое отношение это имеет к палеонтологии?

Alexy


Комбинатор

Цитата: "Alexy"Скорее к эволюции

Я лично работаю в области распознавания рукописного текста. Могу сказать, что прогресс в данной области процентов, наверное, на 60-70 определяется ростом возможностей вычислительной техники, и только оставшиеся 30-40 процентов приходятся на совершенствование алгоритмов распознавания, то есть, софта.

Neska

:oops: Можно вопрос на близкую тему (поскольку текст относится все же к зрительной информации  :wink: )
А от чего зависит эффективность перевода с иностранного языка / на иностранный язык - от мощности вычислительной техники или от софта?
Selbst Moralisten und Moral
sind unmoralisch manches Mal!

За сознательное искажение русского языка порву на британский флаг (преимущественно, высмеиванием)
We share the same biology
Regardless of ideology

Комбинатор

Цитата: "Neska":oops: Можно вопрос на близкую тему (поскольку текст относится все же к зрительной информации  :wink: )
А от чего зависит эффективность перевода с иностранного языка / на иностранный язык - от мощности вычислительной техники или от софта?

Не знаю. Думаю, что в простейших случаях типа обычного подсторчника практически не зависит. А вот если требуется перевод, близкий по качеству к работе профессионального переводчика, то там возникает традиционная проблема комбинаторного взрыва, и, соответственно, данная зависимость может проявляться.

P.S.
Я имел в виду зависимость от вычислительной мощности.

Игорь Антонов

Цитата: "Neska"А от чего зависит эффективность перевода с иностранного языка / на иностранный язык - от мощности вычислительной техники или от софта?
От мощности техники зависит скорость перевода.  Качество -  от софта. При этом проблема качественного и достоверного машинного перевода пока не имеет даже теоретического решения. Фразы естественного языка часто  допускают многовариантность их формальной интерпретации, а их правильный смысл воспринимается нами лишь в контексте жизненного опыта.

Gilgamesh

Распознавание голоса, почерка и... смысла
http://eternalmind.ru/index.php?option=com_content&task=view&id=1210&Itemid=2

Группа синтаксического и семантического анализа при Европейском научно-исследовательском центре Xerox во Франции разработала инструмент поиска FactSpotter, который не просто ищет ключевые слова, а анализирует смысл текста.
FactSpotter выполняет грамматический разбор текста, пытаясь получить дополнительную информацию — например, определить, применяются ли неоднозначные слова в качестве существительных или глаголов и на кого указывает местоимение. Такой анализ позволяет выяснить, что выражения «Билл Гейтс», «он» и «глава Microsoft» в одном и том же документе, вероятно, относятся к одному и тому же лицу. При этом программа должна также установить, что фразы «Билл Гейтс сказал...» и «Друг Билла Гейтса сказал...» предшествуют высказываниям разных людей — в таких случаях поисковые машины, основанные только на ключевых словах, скорее всего, выдадут неадекватные результаты.

Одной из первых служб, использующих FactSpotter, станет Xerox Litigation Services, которая в будущем году встроит его в предназначенный для юристов комплекс программного обеспечения e-discovery. На стадии следствия, когда приходится просеивать миллионы сообщений e-mail и других документов, новый инструмент поможет определять отправителя и получателей сообщений и выбирать информацию о событиях и датах. Эти результаты можно будет использовать для восстановления картины событий, из которой станет исходить следствие.

Для описания грамматической системы разработчики создали специальный метаязык. Пока они используют его для голландского, английского, французского, немецкого, итальянского, португальского и испанского языков. Совместная команда исследователей Fujitsu-Xerox применила этот метаязык и для описания японской грамматики, чтобы продемонстрировать возможность его использования для языков с другой системой письма.

Сам FactSpotter написан на языке программирования С, а дополнительные модули на Java и Python позволяют ему взаимодействовать с другими приложениями. Хотя программа анализирует только тексты, ее можно связать с инструментами распознавания речи, чтобы искать в радио- и ТВ-архивах. Компания уже участвует в нацеленных на это совместных проектах.
Начала Вселенной - атомы и пустота, все же остальное существует лишь в мнении (с) Демокрит

В конце будет наноассемблер

Alexy

Узнавание голоса или почерка вроде не требует понимания контекста.

Поэтому это наверное легче, чем перевод на другой язык или  распознавание рукописного текста (где для опознания одного рукописного символа помогает правильная идентификация соседних).

Nestor notabilis

Откровенно говоря, я очень сомневаюсь, что машина хоть когда-либо сможет хотя бы приблизиться к переводу даже на уровне переводчика средней квалификации. Точно также как никогда не будет проблемы "агрессивного искусственного интеллекта" - алгоритм, имитирующий мышление, формальное мышление, разработать можно. Но вот думать будет некому - у машины нет ядра, которое осознает прочитанное. Она ведь - просто мертвая материя. И в этом вся проблема.
Тут иногда и человек может два часа думать над одним предложением, и только птом "до него доходит", а уж автомат... переведет-то он за пару секунд, но что это будет за перевод?

Максим Деркачев

Цитата: "Nestor notabilis"Точно также как никогда не будет проблемы "агрессивного искусственного интеллекта" - алгоритм, имитирующий мышление, формальное мышление, разработать можно. Но вот думать будет некому - у машины нет ядра, которое осознает прочитанное. Она ведь - просто мертвая материя. И в этом вся проблема.

Ну это утверждение по крайней мере спорно. Машина может и мертвая, однако информация, которой она оперирует, уже довольно сложна и структурирована в гораздо большей степени, чем предполагает неживая материя. Например, задача закрепления довольно сложных условных рефлексов реализована в нейросетях, которые "эволюционируют" очень быстро. Обученные нейросети уже давно способны к самостоятельному обучению (в ограниченных доменах применения, но все же). Например, торгуют акциями гораздо стабильнее и успешнее среднего обученного человека. А техника развивается, то ли еще будет.
Проблема компьютерного перевода - это проблема фиксирования контекстов, причем именно в человеческом понимании. У любого взрослого человека есть гигантский жизненный опыт, позволяющий распознавать контексты. Но даже этот жизненный опыт - дело наживное. Наверняка машинный интеллект будет работать не так же как человеческий  - очень разные элементные базы, но то что он не сможет его имитировать, хотя бы в узких прикладных задачах типа поиска контекстов и перевода - далеко не факт.

Кстати - интересная тема :) Особенно в свете гипотез о постсингулярной цивилизации и х.ф. Терминатор :) Правда это уже пойдет в "небиологический" раздел.

Сергей

Цитата: "Максим Деркачев"Например, задача закрепления довольно сложных условных рефлексов реализована в нейросетях, которые "эволюционируют" очень быстро. Обученные нейросети уже давно способны к самостоятельному обучению (в ограниченных доменах применения, но все же). Например, торгуют акциями гораздо стабильнее и успешнее среднего обученного человека. А техника развивается, то ли еще будет.

Да ничего особого не будет. Среднего - обыграет, а вот умный игрок всегда (в отсутствии программиста, конечно) выиграет у машины. Поскольку, если в игре в шахматы алгоритм игры менять нельзя, то на бирже наоборот - это главное условие крупного выигрыша. Машина не может ставить себе целей, поскольку от выигрыша ей не становится ни тепло, ни холодно. В отличие от живой системы.

Аналогично с переводом: технический текст - без проблем, а вот художественное произведение, в котором много оригинальных суждений для машины будет непреодолим.

Комбинатор

Цитата: "Сергей"
Да ничего особого не будет. Среднего - обыграет, а вот умный игрок всегда (в отсутствии программиста, конечно) выиграет у машины. Поскольку, если в игре в шахматы алгоритм игры менять нельзя, то на бирже наоборот - это главное условие крупного выигрыша. Машина не может ставить себе целей, поскольку от выигрыша ей не становится ни тепло, ни холодно. В отличие от живой системы.

Не вдаваясь в философию, скажу, что у нас машина уже больше года сама, полностью автономно, играет на бирже, и пока в плюсе. (тьфу-тьфу).

Сергей

Цитата: "Комбинатор"
Не вдаваясь в философию, скажу, что у нас машина уже больше года сама, полностью автономно, играет на бирже, и пока в плюсе. (тьфу-тьфу).

Выигрыши, наверно, не столь велики. Иначе бы в игру пренепременно включился кто-то типа Сороса.

Комбинатор

Цитата: "Сергей"
Цитата: "Комбинатор"
Не вдаваясь в философию, скажу, что у нас машина уже больше года сама, полностью автономно, играет на бирже, и пока в плюсе. (тьфу-тьфу).

Выигрыши, наверно, не столь велики. Иначе бы в игру пренепременно включился кто-то типа Сороса.

За первый год торговли прибыль составила 11 с небольшим процентов.
Сейчас запустили вторую версию программы, надеемся на увеличение прибыли до 20-25 годовых, но что получится - посмотрим.