речь. происхождение и развитие, языковые семьи

Автор sanj, ноября 13, 2021, 00:02:59

« назад - далее »

sanj

Лингвисты научились автоматически определять родство языков

Международная группа лингвистов разработала новый эффективный инструмент автоматического определения языкового родства. Aлгоритм Infomap выявляет этимологическое родство слов в разных языках с вероятностью 89 процентов. Отчет об исследовании опубликован в журнале PLoS One.

Важным инструментом выявления генетического родства языков сегодня является идентификация когнатов — слов, имеющих общее происхождение. Этот метод позволяет лингвистам сделать выводы о развитии языков на протяжении тысяч лет и получить новые данные об истории человечества в дописьменную эпоху.

В последние годы активно развивающиеся методы компьютерной обработки позволили создать обширные базы языковых данных, такие как Glottolog и Ethnologue. Однако пока лишь малая часть из более чем 7000 описанных на сегодняшний день языков проанализирована с точки зрения их генетических связей. Это не удивительно, учитывая, что классические сравнительные исследования в лингвистике по-прежнему основаны на ручной работе экспертов с детальным знанием конкретных языков.

Неоспоримое преимущество компьютерных методов заключается в вычислительных скоростях, но до настоящего времени скептики критиковали существующие алгоритмы за большой процент ошибок, ставящих под сомнение их эффективность. В новой работе, опубликованной в конце января, сообщается о том, что международной группе лингвистов в ходе серии тестов удалось добиться удивительной точности выделения генетически связанных слов в родственных языках.

Для определения возможностей автоматического анализа языкового родства исследовательской группой Рассела Грея (Russell D. Gray) были подобраны четыре опубликованных в свободном доступе алгоритма автоматического обнаружения когнатов на основе библиотеки LingPy: Turchin Method, Edit Distance Method, SCA Method и LexStat Method. В дополнение к ним, специально для исследования, был разработан новый алгоритм Infomap.

LingPy — Python Library for Historical Linguistics — представляет собой набор модулей Python с открытым исходным кодом для анализа данных и их визуализации в сравнительно-историческом языкознании.

Отобранные алгоритмы основаны на одном из двух подходов к установлению генетического родства между словами: не связанном с конкретным языком, основанном на формальном сходстве фонем в Turchin, и связанном с конкретными языками на основе известных для них рядов регулярных фонетических соответствий в Edit Distance, SCA, LexStat и Infomap.

Согласно методу П. В. Турчина, алгоритм определяет как этимологически связанные все слова с одинаковым значением, у которых две первые согласных фонемы относятся к одному классу по А. Б. Долгопольскому.

В свою очередь алгоритм Infomap, как и остальные лингвоспецифические методы в LingPy, основан на процессе преобразования матрицы попарных расстояний слов с одинаковым значением методом иерархической кластеризации в граф, вес ребер которого устанавливается с учетом регулярных фонетических соответствий между рассматриваемыми языками. Впервые в Infomap для анализа графа был применен метод случайных блужданий, применяющийся для анализа сетей в биоинформатике и теории коммуникаций. Это сократило количество ложных срабатываний и позволило идентифицировать заимствования.

В ходе исследования для каждого из методов на тренировочных пакетах данных был откалиброван порог наибольшей точности попаданий. В результате, при анализе тестового набора алгоритмам удалось достичь нестандартно высокого процента верного определения родственных слов — от 82 процентов (Turchin) до 89 процентов (Infomap) относительно данных, полученных вручную.

Этот результат доказывает возможность высокой эффективности применения автоматических методов в сравнительно-историческом языкознании. Авторы исследования полагают, что применение этих инструментов значительно ускорит установление генетических связей между малоизученными языками, выделение новых языковых семей. Оно также позволит решить проблему сравнения языков из различных семей, что до этого было практически невозможно из-за объема данных, подлежащих обработке.

Ранее другая международная группа ученых применила новаторский метод компьютерной обработки фонетического состава слов, взятых из лексикона почти половины языков мира. В результате им удалось поставить под сомнение одно из фундаментальных понятий современной лингвистики о произвольном характере связи между фонетическим звучанием слов и их значением. По мнению исследователей, можно говорить о неких исторически базовых механизмах порождения речи, благодаря которым в разных регионах мира люди независимо друг от друга давали сходным явлениям и понятиям фонетически похожие названия.

Елизавета Власова

https://nplus1.ru/news/2017/02/15/lingvo

sanj

Лингвисты назвали Северо-Восточный Китай прародиной трансъевразийских языков

Ученые пришли к выводу, что происхождение трансъевразийских языков можно проследить до начала культивации проса и древнего населения Приамурья. Распространение этих языков включало две основные фазы. Первая была связана с расселением из бассейна реки Ляохэ в сопредельные регионы земледельцев, выращивавших просо в раннем или среднем неолите. Во время второй фазы, относящейся к позднему неолиту, бронзовому и железному векам, земледельцы постепенно смешивались с популяциями из бассейна реки Хуанхэ, Западной Евразии и культуры Дземон.

https://nplus1.ru/news/2021/11/11/transeurasian-languages

Дарвинист

А можно немного подробнее поговорить о древней истории носителей нило-сахарских языков?
Думаю, есть очень любопытная особенность их современного географического распространения.

Уважаемому василию андреевичу, полагаю, было бы интересно взглянуть на это как геологу.

василий андреевич

  Как геологу, говорите? Хорошо, только бы тему не увести внетуда.
  У всех животных есть внутренний (эндогенный) язык общения "органов между собой". Вполне допустимо, что именно эндогенный язык является тем общим, что повлияло на стезю развития всех эукариот.
  Речевая коммуникация - это экзогенный язык, т.е. тем или иным образом кодированные сигналы, находящие соответствующие им декодеры на организменном уровне. Те звуки, которые не находят декодера, естественным образом отмирают. Следовательно, первичен декодер соответствующий природным звукам, хоть гром или треск ломающегося дерева, хоть трель соловья. Природные звуки связаны с ландшафтовой зоной. Если праязык подражательный, то будет верна версия множественности праязыков, как независимых ареалов, расширяющихся с поглощением-вытеснением носителей декодера, с чрезвычайно малой, практически нерегистрируемой толикой зависимой "пращурности". Это подобно: "как ни собирай, все одно автомат калашникова выходит".

  Интересно бы посмотреть со стороны развития гортани. Вполне может оказаться, что первичен тональный язык, как бы без согласных. Согласные появятся, как потребность манипулировать органом-язык, с порождением навыка, отличного от подталкивания пищи к зубам.
  Попробуйте, Эвол, выразить десяток эмоциональных посылов тоносочетаниями, допустим АУО. И посылы будут поняты адекватно.

  Кабы так, то согласными звуками (как короткими волнами), языки обрастают по мере необходимости вмещать в себя языки других народов.

Дарвинист

Цитата: василий андреевич от ноября 13, 2021, 09:53:54Как геологу, говорите? Хорошо, только бы тему не увести внетуда.

Я частично пояснил в теме о распространении культур.

Konof

#5
Цитата: василий андреевич от ноября 13, 2021, 09:53:54Вполне может оказаться, что первичен тональный язык, как бы без согласных.
Въетнамский язык отличается именно тем, что в нём прочтение смысла  слов и даже отдельных звуков зависит от тона. Кстати, на моей теме меня спрашивали о музыке, я не стал особо распространяться, но эволюция музыкальности проистекает именно из этого - передачи части речевой информации тональной кодировкой. Даже у нас, европейцев. Особенно эмоциональный окрас фраз, что важно для музыки как раз.
Ещё есть уникальные койсанские языки. Там часть звуковых символов - разнообразные щелчки. И кстати, койсанцы действительно не просто самый древний народ планеты, но и (только это секрет))) как бы не совсем "люди". Они отделились от основного ствола раньше других групп.
Есть и свистящие языки. Вики:
ЦитироватьСвистящие языки встречаются во многих местах мира, особенно в горных районах, так как в горах из-за особенностей акустики свист способен распространяться на большие расстояния. Свистящие языки особенно часто сопутствуют тональным языкам, где свистящие языки передают тоны слогов (тональные мелодии слов). Это может происходить потому, что в тональных языках тональная мелодия несёт в себе большую функциональную нагрузку, в то время как нетональная фонология меньше информации. Генезис свистящего языка не задокументирован и не изучен.

Gundir

Цитата: Konof от ноября 13, 2021, 16:25:01И кстати, койсанцы действительно не просто самый древний народ планеты
Такого народа нет. Ни самого древнего, ни самого молодого.
Цитата: Konof от ноября 13, 2021, 16:25:01но и (только это секрет)))
а кто, кошки?
Цитата: Konof от ноября 13, 2021, 16:25:01Они отделились от основного ствола раньше других групп.
Кто "они"? Несуществующий народ?

Konof

Цитата: Gundir от ноября 14, 2021, 10:47:04
Цитата: Konof от ноября 13, 2021, 16:25:01И кстати, койсанцы действительно не просто самый древний народ планеты
Такого народа нет. Ни самого древнего, ни самого молодого.

Койсанские народы — условное название группы народов Южной Африки, представители которых говорят на койсанских языках и/или принадлежат к капоидной расе.

Включают бушменов и готтентотов.

Сам термин «койсан» (< нама khoi «человек» + san «бушмен») был предложен в 1928 году этнографом Л. Шульце для обозначения общего физическо-расового типа этих народов. В 1963 году Дж. Гринберг связал с этим термином предложенную им ранее макросемью, которую он сам сначала называл «Click languages». В качестве обоснования этой гипотезы Гринберг указал на некоторые типологические сходства и лексические параллели, а главное — на наличие в этих языках щёлкающих согласных (кликов).

Учёными было подтверждено, что койсанские народы с древнейших времён были изолированы от остального человечества. Среди них были обнаружены группы, живущие порознь в течение 30 тысяч лет. Научные работы с результатами исследований вышли в журналах Science и Nature Communications[en][1].
Цитироватьа кто, кошки?
Генетики провели анализ однонуклеотидных полиморфизмов (SNP) в хромосомной ДНК представителей разных африканских племён. Согласно опубликованным данным анализа митохондриальной ДНК, койсанские народы принадлежат к субкладе L0d митохондриальной гаплогруппы L0. Разделение гаплогруппы L0 (мтДНК) на субклады L0k и L0d произошло свыше 100 тысяч лет назад в Африке[2][3]

sanj

тоновые языки это нечто конечно. мне совсем непонятно как там люди общаются. ведь если все зависит от тона, то ведь полно людей с отсутствием слуха. и скажем на миллиард китайцев наверняка таких не один и не два, тем не менее они говорят на таком языке.

про щелчки тоже интересно, но есть еще какая-то африканская группа, которая говорит на вдохе. т.е. все остальные люди по миру произносят звуки выдыхая воздух, а те вдыхая. смотрел как-то фильм про это, но забыл их этноним.

Дарвинист

Я, разумеется, не просто так спросил про нило-сахарские языки.
Если взглянуть на географическую карту распространения языковых макросемей, человек, искушенный в живописи и искусстве, сразу же обратит внимание на то, как сильно распространение языков напоминает воронку. На острие-основании которой ныне находятся языки семьи из Экваториальной Африки - конго-нигер.
Севернее довольно компактно располагаются языки афроазийской макросемьи. Что важно, через общий ареал этих языков пролегли пути миграции древних сапиенсов в Евразию. Далее, более широкую часть воображаемой воронки занимают языки индоевропейской группы народов. Что примечательно, при, даже, поверхностном взгляде, можно обратить внимание, что территория расселения индоевропейцев на этапе до окончания бронзового века примерно совпадает с расселением неандертальцев.     

Дарвинист

А именно с неандертальцами, похоже, активно взаимодействовали сапиенсы на Ближнем Востоке на позднем этапе среднего палеолита, в эпоху перехода к верхнему. Наконец, севернее и восточнее мы наблюдаем веер макросемей, перечисляю в направлении от Приуралья к Индонезии: уральская,языки Северо-Восточной Азии, алтайская, сино-тибетская, австронезийская и языки Австралии и Океании.

В Новом Свете, по ходу дела, наблюдается сходная картина, только будто отраженная в зеркале, с той разницей, что экваториальные леса Африки здесь заменены на леса бассейна рек Амазонка и Ориноко. 

Дарвинист

Но, это с точки зрения художника, повторюсь. Возможно, физик-ядерщик сказал бы, что подобный расклад напоминает ему секторальный срез через атом, в котором дистанция от конго-нигерского ядра до границы расселения неандертальцев и индоевропейцев может быть определена как боровский радиус - расстояние от ядра до ближайшей к ядру орбиты электрона.

Дарвинист

А, теперь, уважаемые участники и гости форума, обратите, пожалуйста, внимание на географию распространения нило-сахарских языков. В основном, они занимают территории, соответствующие бассейнам центральноафриканских мегаозер и системы болот в среднем течении р. Нигер. Разделяя, таким образом, австроазийцев от носителей конго-нигерских языков, европеоидов от банту и родственных им народов, обществ, исповедующих, преимущественно, ислам от христианской Африки и Африки, где господствуют традиционные верования.

В соседней теме я пишу об археологических культурах, в частности среднего палеолита Африки. По видимому, там эта же закономерность также хорошо просматривается. Много общего с тем эта закономерность связывает и физико-климатические условия существования человека. Очевидно, что все это, по моему мнению, проявления некоторого единого закона развития (отражения реальности), результатом действия которого является то, что за десятки тысячелетий данная закономерность не утратила своей актуальности.

василий андреевич

Цитата: Дарвинист от ноября 15, 2021, 06:48:02закономерность
Как Вы думаете, можно ли надеяться, что при переходе от кочевья к оседлости уже сформировавшийся язык, претерпит качественный скачок?
  Ведь одно дело заимствовать звукосочетания у соседей, другое - рождать их на базе собственной, условно изолированной эволюции.

Gundir

Цитата: Konof от ноября 14, 2021, 11:13:28Койсанские народы — условное название группы народов Южной Африки, представители которых говорят на койсанских языках и/или принадлежат к капоидной расе.

Включают бушменов и готтентотов.
Т.е., речь идет не о народах, а либо о популяции, либо о языковой семье
Цитата: Konof от ноября 14, 2021, 11:13:28Учёными было подтверждено, что койсанские народы с древнейших времён были изолированы от остального человечества. Среди них были обнаружены группы, живущие порознь в течение 30 тысяч лет. Научные работы с результатами исследований вышли в журналах Science и Nature Communications[en][1].
Ниче там не подтверждено. Старостин, например, пишет, что время образования языковых семей это 1 т.л. до н.э. (для центрально-койсанской) или 4-5 т.л. до н.э. (для переферийно-койсанской) Молодые макросемьи, раза в два-три моложе, например, афрофзиатской (12 т.л. до н.э.)
https://polit.ru/article/2016/12/25/starostin_lecture/
Цитата: Konof от ноября 14, 2021, 11:13:28Генетики провели анализ однонуклеотидных полиморфизмов (SNP) в хромосомной ДНК представителей разных африканских племён. Согласно опубликованным данным анализа митохондриальной ДНК, койсанские народы принадлежат к субкладе L0d митохондриальной гаплогруппы L0. Разделение гаплогруппы L0 (мтДНК) на субклады L0k и L0d произошло свыше 100 тысяч лет назад в Африке
Вы прикиньте, что 100 тыщ лет назад - это еще вообще не сапиенсы, и, они отличны от нас ну очень сильно, чего не скажешь о бантоидах. Т.е. , надо предположить совершенно независимое конвергентное эволюционное изменение при этом почти совершенно одинаковое. Вероятность такого события равна вероятности обезьяне случайно тыкая в клавиши отпечатать библию.
Дробышевский находит бантоидные черепа только голоценового времени (самые древние примерно 11 тыщ лет) Ну а сомнительные есть типа 20 тыщ лет (но, никак не сотни)
https://antropogenez.ru/zveno-single/331/
https://antropogenez.ru/zveno-single/332/
https://antropogenez.ru/zveno-single/333/