"Системы коммуникации животных используют тон намного больше, чем человеческие... животные, видимо, используют несколько десятков различных тонов."
На каких фактических данных основано это утвеждение?
Это мое предположение, основанное на том, что имеется ограниченный набор звуковых кластеров и много предметов, которые должно обозначить.
А вы не пытались это предположение проверить? На примере коммуникации шимпанзе, например.
Древнейшие находки гоминид за пределами Африки - это Дманиси. Вы утверждаете, что у эргастеров из Дманиси был язык, и был именно в виде "вышеописанной системы". На чем, кроме Ваших умозрительных построений и допущений, это основано? А почему, например, не язык жестов (гипотезы Корбаллиса и Томаселло)?
Меня интересует возникновение именно звукового языка.
По мнению Корбаллиса, жестовый язык предшествовал звуковому, причем довольно длительное время (если не ошибаюсь, чуть ли не до верхнего палеолита...)
Вы вообще рассматриваете иные существующие гипотезы? (их существует немало).
Мне интересны все гипотезы.
Но Вы же выдвигаете Вашу гипотезу, значит должны показать, чем она лучше существующих.
Гипотезу Нобуо Масатаки (язык как средство эмоционального контакта; языку предшествует стадия "коллективного пения").
Это очень японская гипотеза, так и видишь как первые гоминиды утром сидят вокруг очага и поют "Тоёта, Тоёта, наша корпорация, Тоёта, ты превыше всего", японцы такие японцы. 
Ну, вы же сами утверждаете, что для наших предков высота звука была очень важна. А Масатака гипотезу свою выводит, рассматривая в качестве "прототипа языка" диалог матери с "гулящим" ребенком.
Высокий голос привлекает внимание ребенка, ритм провоцирует эмоциональный отклик — в результате ребенок лучше понимает мать, а впоследствии лучше овладевает языком. По мнению Масатаки, эти же две стадии проходили и гоминиды на своем пути к языку: стадия «гуления» создала слоги, используемые для установления эмоционального контакта, на стадии «лепета» возникли многосложные звуки, и контакт стал более богатым и более комплексным. Третьей стадией, по этой гипотезе, могло быть коллективное пение, подобное дуэтам, которые сегодня можно наблюдать у гиббонов. Такая коммуникация развивала не только чувство сплоченности, но и слух, и навыки звукового подражания — со временем это легло в основу не только языка, но и музыкальных способностей человека. На этой стадии эмоциональный контакт распространился на всю группу, на смену эгоизму пришло ощущение принадлежности к коллективу, что и подготовило почву для развития языка.
С. Бурлак, "ПРОИСХОЖДЕНИЕ ЯЗЫКА. ФАКТЫ, ИССЛЕДОВАНИЯ, ГИПОТЕЗЫ"