Эволюция языков.

василий андреевич · июня 24, 2024, 08:56:45

Цитата: Gundir от июня 23, 2024, 14:24:22Еще как поспоришь. Время, когда славяне появляются на Балканах нам очень хорошо известно. Это 6-7 века. Все задокументировано, буквально по годам, разве что не поименно, и Ваши будущие македонцы приходят туда в общей толпе, это пришельцы.

С чем спорить, с теорией или ее частными производными (интерпретациями)? Статистика, это такая пакость, что отличается от условной нормы данных тем больше, чем ОНА точнее. Когда б выборку делать не по сотне, а по мульону языков, то обязательно вылезет единственный праязык-предок, которого не было. Это как с мтх Евой и У-Адамом.

Виктор приближается к описанию идеи волновой механики, а квадратичное удаление берется из теории Смолуховского-Эйнштейна.

Экспоненты удобны тем, что график становится линейным при использовании логарифмической шкалы, и наоборот, усредняя шкалу до "среднескоростной" получим графики подпадающие под ту или иную экспоненту.
Потому, если народы пришли скопом в македонию и там осели, то у них сложится тот язык, который при последующих дивергенциях станет прамакедонским-праславянским. И уже для его экспонентных ветвлений потребуется подобрать одно из великих (и не очень) переселений. От переселения до переселения - это период, который будет составлять приблизительно одну четвертую от более крупного переселения, включающего большее число народов с их языками.
Сложив косинусы кратных переселений, обязательно получим сложную графику, на которой будут выделятся острый пик "языкового расцвета (сингулярность)" и пологая сдвоенная впадина "инфляции" (сдвоенный кризис). Между сингулярностью и инфляцией получим три-четыре волнистых "площадки", которые будут фрактальны общей кривой.

И ведь действительно, взяв во внимание только восходящую часть графика получим "усреднее" ускорение эволюционного процесса. И этот процесс восхождения необратим, потому что вымершие языки и народы, мы из вводной статистики исключаем!!!

Alexeyy · июня 24, 2024, 10:10:57

Цитата: Виктор Меркатор от июня 23, 2024, 13:59:39...
И пришло в голову соображение. Племя не может быть очень большим - охотникам надо отходить дальше чтобы запастись едой, женщинам дальше отходить чтобы копать корешки. оттого при достижении критического числа часть племени отселяется и контакты превращаются, а далее каждые 70 лет по законам языка начинает заменяться одно слово в 100-словном списке.
Если считать каждый факт расселения племени рождением нового языка (окончательное оформление вплоть до непонимания произойдет за 800 лет), то число языков будет пропорционально населению.

Думаю, эти соображения можно обобщить на случай, чтобы не оперировать с каждым "ручейком".
Племя занимает некоторую экологическую нишу. Его дробление будет означать, что дочернее займёт несколько другую экологическую нишу. Экологическая ниша определяется, да и ручейками (более обще - географией). Но не только: у человека экологическая ниша, во многом, создаётся "второй природой", создаваемой человеком. С помощью технологий. В процессе антропогенез биотическая технологическая ниш, постепенно, перерастает в технологическую. Точнее, в техноценотическую. Б. И. Кудрин обратил присатльное внимание, что как в биоценозах, так и в техноценозах имеется одно и то же гиперболическое ранговое распределение структурных элементов ценозов.
Предполагаю, что это как-то должно создавать основу того, что число людей будет пропорционально числу языков и после того, как люди,постепенно, выходят из своих природных ценозов (биоценозов) в техноценозы (гораздо более крупные поселения, города). В городах, например. тоже есть своё дробление н районы, подрайоны. Фрактальная структур. Исследования показали, что она есть и в биоценозах.
Хотя, наглядно, себе и не очень представляю каков здесь механизм, обеспечивающий пропорциональность числа языков и людей. Предмет для специального исследования н стыки лингвистики, демографии и, может, много ещё чело.

Виктор Меркатор · июня 24, 2024, 14:24:23

Цитата: Alexeyy от июня 24, 2024, 07:38:39
Цитата: Виктор Меркатор от июня 24, 2024, 07:33:22Спасибо, поехал на пляж, хорошая погода редкость, вчера был ливень. Оценка центра распределения по размаху не лучший вариант, математики применяют минимум среднеквадратического отклонения.
Минимум среднеквадратичного отклонения применяется исключительно потому, что в докомпьютерную эру он позволял быстро оптимизировать аналитически (производные легко берутся, приравниваются к нулю и просто ищется точное аналитическое решение). Но, по логике вещей, правильнее было бы брать модуль, а не его квадрат. Но на практике результат выходит, практически, тождественен.

Есть версия с модулем, если в данных большой раздрай, распределены не по нормальному. Но при случайных отклонениях по нормальному закону правильнее сигму считать. Полюбому середина размаха дает огромную погрешность.
В докомпьютерную эру все считалось с трудом, для того и изобрели таблицы логарифмов чтоб облегчить.
Впрочем были арифмометры Феликс. На них все советские самолеты считали. Может быть даже ракеты. В институтах решить плевую систему из 3-4 линейных уравнений учили целую лабу 2 пары отводили на феликсах, и не все решали, приходили потом досдавать. Проверял не препод, лаборант по ответам и контрольному числу.
Если бы не компьютер (386 собрал сам, полгода покупал запчасти по одной), не занялся бы лингвистикой. А так нарыл в глоттохронологии, законе Ципфа и теории тестов.

Виктор Меркатор · июня 24, 2024, 14:39:05

Цитата: Alexeyy от июня 24, 2024, 10:10:57
Цитата: Виктор Меркатор от июня 23, 2024, 13:59:39...
И пришло в голову соображение. Племя не может быть очень большим - охотникам надо отходить дальше чтобы запастись едой, женщинам дальше отходить чтобы копать корешки. оттого при достижении критического числа часть племени отселяется и контакты превращаются, а далее каждые 70 лет по законам языка начинает заменяться одно слово в 100-словном списке.
Если считать каждый факт расселения племени рождением нового языка (окончательное оформление вплоть до непонимания произойдет за 800 лет), то число языков будет пропорционально населению.

Думаю, эти соображения можно обобщить на случай, чтобы не оперировать с каждым "ручейком".
Племя занимает некоторую экологическую нишу. Его дробление будет означать, что дочернее займёт несколько другую экологическую нишу. Экологическая ниша определяется, да и ручейками (более обще - географией). Но не только: у человека экологическая ниша, во многом, создаётся "второй природой", создаваемой человеком. С помощью технологий. В процессе антропогенез биотическая технологическая ниш, постепенно, перерастает в технологическую. Точнее, в техноценотическую. Б. И. Кудрин обратил присатльное внимание, что как в биоценозах, так и в техноценозах имеется одно и то же гиперболическое ранговое распределение структурных элементов ценозов.
Предполагаю, что это как-то должно создавать основу того, что число людей будет пропорционально числу языков и после того, как люди,постепенно, выходят из своих природных ценозов (биоценозов) в техноценозы (гораздо более крупные поселения, города). В городах, например. тоже есть своё дробление н районы, подрайоны. Фрактальная структур. Исследования показали, что она есть и в биоценозах.
Хотя, наглядно, себе и не очень представляю каков здесь механизм, обеспечивающий пропорциональность числа языков и людей. Предмет для специального исследования н стыки лингвистики, демографии и, может, много ещё чело.

О, знакомые слова обнаружил. Я одно время законом Ципфа для языков занимался, его потом Мандельброт усовершенствовал (который фракталы), потом Ворончак из Варшавы еще 1 член добавил, потом я этот член, за отсуствием базового образования и лени читать классиков, сам открыл и опубликовал ничтоже сумняшеся, извинился перед кафедрой Ворончака (он к тому времени нас покинул), а в порядке компенсации открыл на распределении особенность, названную мною кратером. На этом история имхо модификаций закона Ципфа завершилась.

Alexeyy · июня 24, 2024, 15:15:41

О! Моё почтение (тоже моя когда-любовь - к гиперболическим распределениям)!

Цитата: Виктор Меркатор от июня 24, 2024, 14:24:23... а в порядке компенсации открыл на распределении особенность, названную мною кратером.

Очень интересно! Не знал про такое.

Цитата: Виктор Меркатор от июня 24, 2024, 14:24:23... за отсутствием базового образования и лени ..

Да ладно ... вот побольше бы нам таких ленивых.

Цитата: Виктор Меркатор от июня 24, 2024, 14:24:23Есть версия с модулем, если в данных большой раздрай, распределены не по нормальному. Но при случайных отклонениях по нормальному закону правильнее сигму считать.

А в чём правильнее? Каков критерий правильности? Может, просто сходимость, если минимизировать дисперсию, при нормальном распределении быстрее будет (быстрее считаться будет)? Кажется, как-то пробовал на другом аналогичном примере считать и с модулем и с квадратом и получился, практически, тождественный результат.

Виктор Меркатор · июня 24, 2024, 16:39:29

Цитата: Alexeyy от июня 24, 2024, 15:15:41О! Моё почтение (тоже моя когда-любовь - к гиперболическим распределениям)!

Цитата: Виктор Меркатор от июня 24, 2024, 14:24:23... а в порядке компенсации открыл на распределении особенность, названную мною кратером.
Очень интересно! Не знал про такое.

Цитата: Виктор Меркатор от июня 24, 2024, 14:24:23... за отсутствием базового образования и лени ..
Да ладно ... вот побольше бы нам таких ленивых.

Цитата: Виктор Меркатор от июня 24, 2024, 14:24:23Есть версия с модулем, если в данных большой раздрай, распределены не по нормальному. Но при случайных отклонениях по нормальному закону правильнее сигму считать.
А в чём правильнее? Каков критерий правильности? Может, просто сходимость, если минимизировать дисперсию, при нормальном распределении быстрее будет (быстрее считаться будет)? Кажется, как-то пробовал на другом аналогичном примере считать и с модулем и с квадратом и получился, практически, тождественный результат.

Да я тоже баловался разными степенями отклонения. Квадрат (классика), модуль (особый изыск), и даже корень из модуля. Оно ведь чем ниже степень, тем меньший вес имеют выбросы, из этого и исходят. Но классика это все-таки квадрат, потом отсеивание выбросов (промахов и пр.). Об этом хорошо Мостеллер Тьюки (2 тома) писали, и Ван дер Варден, очень понятно для не математиков.
Базовое это филфак МГУ + аспирантура на соотв. кафедре там же, чего нет. Не считать же 2-е образование иняз за филфак + Чтение. И математика в объеме 1-го инженерного + чтение. Это тоже не математика.

Alexeyy · июня 24, 2024, 18:45:36

Цитата: Виктор Меркатор от июня 24, 2024, 06:46:01Про то, что заимствования не следует учитывать в коэффициенте совпадения, писал уже Сводеш, проблема в субъективности. Даже по коэф. совпадения 2 современных хорошо изученных языков расхождения. нашел упоминание в серьезной статье, что данные Дайена и пр. содержат ошибки, без упоминания где и что и какого рода. Если какой спец нашел 1 ошибочное соотвествие или несоответствие в одной паре языков, это систему не разрушит, дело в проценте ошибок. Опять же разные школы соответствия/несоответствия оценивают по-разному.

В модели заимствования оцениваются формально, а это требует постулирования экспоненциальности распада.

Если правильно понял, для того, чтобы исключить заимствования - строится какая-то модель, по которой вычисляются заимствованные слова и отбрасываются или как?

П. С.: Никогда не думал, что доведётся поговорить с кем-то, кто занимается лингвистическими реконструкциями: мне почему-то всегда казалась эта тема - чудовищно сложна, "недосягаема" (как и те, кто ею занимаются).

Виктор Меркатор · июня 24, 2024, 20:41:44

Цитата: Alexeyy от июня 24, 2024, 18:45:36
Цитата: Виктор Меркатор от июня 24, 2024, 06:46:01Про то, что заимствования не следует учитывать в коэффициенте совпадения, писал уже Сводеш, проблема в субъективности. Даже по коэф. совпадения 2 современных хорошо изученных языков расхождения. нашел упоминание в серьезной статье, что данные Дайена и пр. содержат ошибки, без упоминания где и что и какого рода. Если какой спец нашел 1 ошибочное соотвествие или несоответствие в одной паре языков, это систему не разрушит, дело в проценте ошибок. Опять же разные школы соответствия/несоответствия оценивают по-разному.

В модели заимствования оцениваются формально, а это требует постулирования экспоненциальности распада.
Если правильно понял, для того, чтобы исключить заимствования - строится какая-то модель, по которой вычисляются заимствованные слова и отбрасываются или как?

П. С.: Никогда не думал, что доведётся поговорить с кем-то, кто занимается лингвистическими реконструкциями: мне почему-то всегда казалась эта тема - чудовищно сложна, "недосягаема" (как и те, кто ею занимаются).

Все просто: традиционная глоттохронология, взяв модель углеродного распада, слепила 2 разных переменных - дивергенцию и конвергенцию и назвала эту сумму расстоянием между предком и современным языком. Первым спохватился сам Сводеш - призвал в своих первых работах исключить заимствования. Вопрос только как их определить, какое слово из списка английского языка заменилось в процессе его естественного развития а какое пришло скажем от норманов. Когда все лежит на поверхности, т.е. известен язык норманов и зафиксировано, что слова не было до битвы при гастингсе а после появилось, оно заимствовано и его исключают. Если бы так было во всех случаях. У Старостина вся система построена на исключении заимствований, это тонкая филигранная работа.
Модель же не требует никаких предварительных знаний, достаточно расчленить одну переменную на 2 путем анализа всей языковой системы. В работе 2003 года которая по данным Сводеша, все просто.

https://www.arxiv.org/pdf/cs.CL/0303007

https://www.researchgate.net/publication/ 336684292_Glottohronologia_i_problemy_praazykovoj_rekonstrukcii

Сам факт, что 2 совершенно независимых, по разным языковым системам из 4 языков оценки конвергенции между языками лилуит и шусвап совпали, убедительное доказательство что модель работает. Если мы наблюдаем редкое событие, оно не редкое, оно закономерное.

Аналогично 2 полочки на известном графике. Не могут 5 а потом 4 события случайно собраться практически в одну точку во времени, это также закономерность. Условно в первом случае бронзовое оружие (только версия) во втором точно Великое переселение. Причину которого тоже не знаем (похолодание, вулканы, самая без доказательств теория метеорита), но факт налицо. Притом традиционный Сводеш эти полочки не видит, они размываются погрешностью метода (как в ТВ на фото подростков и детей по закону забрюливают лицо - а что такое забрюливание - уменьшение разрешающей способности, т.е. уменьшение точности передачи). А в традиционном Сводеше точность определения времени (дивергенции) искажается конвергенцией. Следовательно, надо эти 2 переменные выделить в чистом виде из прежней 1 переменной. Как удалось - предмет обсуждения. Скажем, обработаем тюркские языки, но также нужна огромная матрица. Если традиционный Сводеш берется определить время разделения по паре языков, то модель требует привлечения как можно большего количества данных.
Чтобы определить, насколько русский язык конвергировал от общего ствола, привлекаются данные совпадению русского и македонского с прочими 82 языками. Это же общее правило статистики - чем больше данных (выборка), тем меньше погрешность.
Оттого одно время шел стеб над 35-словными списками - вопреки всем законам статистики объявлялось, что расчеты по меньшему числу слов точнее чем по большему.

Alexeyy · июня 25, 2024, 03:04:39

Цитата: Виктор Меркатор от июня 24, 2024, 20:41:44Модель же не требует никаких предварительных знаний, достаточно расчленить одну переменную на 2 путем анализа всей языковой системы.

Интересно. Как говорится, "всё гениальное - просто".

Вы только на индоевропеском стволе опробовали или и на чём-то ещё?

Виктор Меркатор · июня 25, 2024, 06:04:30

Цитата: Alexeyy от июня 25, 2024, 03:04:39
Цитата: Виктор Меркатор от июня 24, 2024, 20:41:44Модель же не требует никаких предварительных знаний, достаточно расчленить одну переменную на 2 путем анализа всей языковой системы.
Интересно. Как говорится, "всё гениальное - просто".

Вы только на индоевропеском стволе опробовали или и на чём-то ещё?

Раньше было на отдельных группах ИЕ. И самая первая работа на сэлишских языках (индейцы Америки, 6 языков) по работе Сводеша.
Относительно циклов Кондратьева. Оно конечно трудно говорить об экономических циклах на протяжении 4400 лет, но эти циклы ведь привязаны по Чижевскому к солнечной активности. Там 11,2 года только в среднем, по факту от 6 лет и выше. И циклы Кондратьева их 5 насчитали в экономике среднее 50 лет +/- 10 лет. Тогда никак не должно быть совпадения периода в годах с фазой цикла. Если в данных есть цикличность в сводешах, то можно только определить средний период в сводешах. И сравнить со средним периодом кондратьевских циклов в годах. А кондратьевские циклы +/- 20%. Как на основании этого пытаться скорректировать сводеши на 13% или 6%?

Alexeyy · июня 25, 2024, 07:49:46

Цитата: Виктор Меркатор от июня 25, 2024, 06:04:30Относительно циклов Кондратьева. Оно конечно трудно говорить об экономических циклах на протяжении 4400 лет, но эти циклы ведь привязаны по Чижевскому к солнечной активности.

По моей информации, не всегда есть корреляция социально-экономических циклов с циклами солнечной активности - для времён более древних, чем рассматривал Чижевский.
Сокращающиеся циклы - фрактальны: одни наложены на другие более крупные, состоят из более мелких. Поэтому, какие не возьми, примерно, постояннопериодические, астрофизические циклы - всегда в этом фрактальном спектре, примерно, в то же время можно будет обнаружить циклы, близкие к этим постояннопериодическим астрофизическим. Думаю, именно это и произошло с циклами Чижевского.

Есть мнение, что кондратьевские циклы - сокращаются. Я исследовал сокращающиеся социально-экономические циклы по разным характеристикам и построил их "идеальную" хронологию (в пренебрежении флуктуациями). Потом мне попалась статья в которой исследуются кондратьевские циклы по уровню цен США в золотом и нефтяном эквивалентах и продлил до современности. К своему удивлению, обнаружил корреляцию с упомянутыми идеальными циклами и сделал вывод, что кондратьевские циклы - сокращаются.
Вот, например, средний уровень цен (грубо говоря, цена некой ключевой группы товаров) в нефтяном эквиваленте (в пересчёте как если бы товары продавались не за деньги, а за литры нефти):

Вам недоступны вложения в этом разделе.

Тёмные полосы - это то же самое, что и на выше приводимых рисунках. А вот индекс мощи российского государства:

Вам недоступны вложения в этом разделе.

Абсцисс (теперь - логарифмическая шкала) - годы с началом отсчёта в ~2050. Т.е. также, как на графике частоте возникновения индоевропейских языков. И тёмные полосы - то ж е самое (т.е. теперь циклы выглядят постояннопериодическими из-за логарифмичности шкалы).
Эти же циклы обнаружил и по многим разным другим характеристикам. Для разных хвра4кткристик - с разной широтой охвата (по мере доступности данных). Но, в целом, на протяжении многих тысячелетий.
В результате у меня не осталось сомнения в реальности их существования. А правильность Вашей модель замечательным образом, косвенно, подтверждается наличием этих циклов.
Если построите аналогичную модель для тюрпских языков, то, скорее всего, тоже будут видны аналогичные сокращающиеся циклы (правда, хуже или меньше циклов будет видно т.к. тюрпских языков - в разы меньше).

Цитата: Виктор Меркатор от июня 25, 2024, 06:04:30И самая первая работа на сэлишских языках (индейцы Америки, 6 языков) по работе Сводеша.[/attach]
А для них какие даты узлов получились? Посмотрим, нет ли какой корреляции с сокращающимися циклами и для них. Хотя, маловероятно из-за того, что статистика - не велика, но, вдруг...

Виктор Меркатор · июня 25, 2024, 10:19:55

Да какие там циклы по сэлишам. Смотрите, 6 языков, работа 2003 года в библиограии репринта.

Кто знает, где есть матрица тюркских языков?

Другое дело, что точность пропорциональна корню из выборки, оттого 21 язык точность огрубляется в 2 раза в сравнении с 84 языками. Это значит полочки если есть их не выявить.

А чтобы повысить точность ИЕ в 2 раза, надо 336 языков, живых и современных. Все суржики и трасянки придется привлечь, и сколько там пар списков надо сравнить? Вручную никому не поднять, нужен алгоритм для компьютера.

Если период цикла закономерно изменяется, это 100 пудов сложение двух (как минимум) циклов с близкими периодами. Скажем, 45 и 55 лет. Это же общее место - расщепить одну переменную на две. Как примерно расстояние на дивергенцию и конвергенцию. Или наложение на быстрый цикл медленного, тогда тоже период может меняться. Оно же все рваное, никак не чистые синусы, как там периоды считать. Ни по максимумам, ни по минимумам, ни по пересечению средней гарантии нет что угадаешь.

Alexeyy · июня 25, 2024, 10:59:30

Цитата: Виктор Меркатор от июня 25, 2024, 10:19:55Да какие там циклы по сэлишам.

Посмотрим. Скажем, возникновение каждого языка придётся на 1 цикл (или на характерную часть цикла). Может, и нет.

Виктор Меркатор · июня 25, 2024, 11:07:46

Там языки идут с интервалом 5-6 сводешей. Что, конечно вроде цикл, но всего по 2 волнам языков всего 6. Сколько 1 сводеш лет неведомо, какая калибровка по индейцам без письменной истории. Но если общая закономерность 71 год, то "цикл" 390 лет.
Там глубина кста приличная, 25 сводешей, самое начало н.э. Там коэф. совпадения до 19% падали между языками, полное непонимание. Столько у русского с бенгальским, не уверен что что пойму. Разве названия йоговских асан начну говорить, они что знакомое услышат.

Alexeyy · июня 25, 2024, 11:17:33

Опозжа гляну.

Хотел ещё Вас спросить на счёт одного отрицательного получившегося возраста для индоевропейских языков: у меня не укладывается в голове. Как-то на пальцах для "чайников" можно это объяснить? В генетике почему-то никогда с аналогичным не сталкивался.