Search
  • thierrygrenot

Natural language: a child’s play


The school teacher and her pupils - by Robert Doisneau, 1950


Based on the intuition that natural language is an effective and radical solution to the lack of interoperability within the Internet of Things, it seemed natural to us to look somewhat at its origins. There is a numerous scholarly literature on this subject, to which the curious reader can refer.


Mysterious origin

The origin of the appearance of natural language, one of the greatest mysteries of all time, gives rise to many controversies. Some believe that brain size is decisive (although some animals such as primates, birds and even bees have rudimentary language). Others argue that a low larynx position is necessary for the formation of an articulated language, which limits candidates in time and species. Finally, the sociological hypothesis proposes that language has developed gradually thanks to the advantages it confers on those who master it (more effective hunting and gathering, better protection against animals and hostile tribes, etc.).

However, there seems to be a consensus that only Sapiens (and perhaps Neanderthals) possessed a natural language as we hear it today (despite others believe that Lucy, a graceful Australopithecus more than 3 million years old, had the physical characteristics necessary for language, although we do not know her intellectual and social talents).

The first language was spoken (perhaps supplemented by signs). Written forms of language have only recently appeared in Mesopotamia and Egypt (about 5,000 years ago), with the emergence of agriculture, sedentary living and the resulting social organization: accounting documents (clay tablets) , civil code (Hammurabi code), epic stories (texts of the pyramids).


Bold explorers

The Swiss scholar Ferdinand de Saussure (1857-1913), often referred to as the father of modern linguistics and semiotics, insisted on the arbitrary relationship between the word (the signifier) and the thing (the signified). The cry of a cow is not "cow" and the sequence of signs "c o w" does not particularly look like the animal: there is therefore a transition from the tangible to the abstract (both oral and written), and then sharing this convention between the interlocutors. Which is not a small wonder.

French physician, Paul Broca (1824-1880) first identified the area of language in the human brain. One of his patients (Mr. Leborgne) with profound aphasia was unable to communicate (apart from the onomatopoeia "Tan Tan", which became his nickname), albeit with normal intellectual abilities. At the time of his death, examination of his brain revealed a brain injury in the left lower frontal cortex, later called the "Broca’s area". Shortly thereafter, the German neurologist Carl Wernicke (1848-1905) showed that another area of the brain ("Wernicke's area") was also involved in the production and understanding of language.

Finally, in the second half of the 20th century, the famous American linguist Noam Chomsky proposed the existence of a primordial language, from which all the others would derive. It is said to be directly sourced from genetic abilities, and should be detected in the languages currently in use. This original language has not yet been discovered, partly because of the peculiarities of the current languages that blur these common roots. And since it is likely that several linguistic centers have appeared simultaneously in the world, this question remains particularly difficult.


Children are the real magicians of language

The little child acquires language in a particularly intriguing way. Before his birth, he discovers the useful sounds, transmitted by his mother (literally his "mother tongue"). He gradually refines his ability to recognize them, to the detriment of other (a Japanese does not "hear" the sound "v" or "l"; likewise a Spanish "v" sounds like a French "b"). Then the child learns (discover?) by himself a rudimentary syntax and becomes able to make simple sentences. The acquisition of vocabulary is a breeze: above 1,000 words from 3 years old!

What is really surprising is that language learning does not involve "big data", gigantic corpora, learning more or less deep... Around the world, children learn to speak without a grammar book, with very few trial/error cycles. And yet it works! This simple observation, accessible to all parents, makes specialists lean towards the existence of innate abilities to master natural language, in addition to the cultural aspect (interactions with the entourage).

The transition from the thing (the signified) to its abstract representation (the signifier) is already a tour de force in itself. The ability to do so with a flexible syntax, using few signs while supporting an infinite number of shapes, is another. We have integrated these two aspects so well that we are not even conscious of them.


Since natural language works so well for communication between people - why not use it to make infinitely simpler and more concrete things communicate?


Le langage naturel : un jeu d’enfant


Partant du constat que le langage naturel est une solution efficace et radicale à l’absence d’interopérabilité au sein de l’Internet des Objets, il nous est apparu naturel de s’intéresser quelque peu à ses origines. Il existe une nombreuse littérature savante à ce sujet, à laquelle le lecteur curieux pourra se référer.


Mystérieuse origine

L’origine de l’apparition du langage naturel, un des plus grands mystères de tous les temps, donne lieu à de nombreuses controverses. Certains pensent que la taille du cerveau est décisive (bien que certains animaux tels les primates, les oiseaux et même les abeilles aient un langage rudimentaire). D’autres soutiennent qu’une position basse du larynx est nécessaire à la formation d’un langage articulé, ce qui limite les candidats dans le temps et les espèces. Enfin, l’hypothèse sociologique propose que le langage se soit développé progressivement grâce aux avantages qu’il confère à ceux qui le maîtrisent (chasse et cueillette plus efficaces, meilleure protection contre des animaux et les tribus hostiles, etc.).

Il semble toutefois qu’il y ait consensus sur le fait que seul Homo Sapiens (et peut-être l’Homme de Néandertal) ait possédé un langage naturel tel qu’on l’entend aujourd’hui (d’autres estiment que Lucy, gracieuse australopithèque de plus de 3 millions d’années, avait les caractéristiques physiques nécessaires au langage, à défaut de pouvoir estimer ses talents intellectuels et sociaux).

Le premier langage était parlé (peut-être complémenté par des signes). Les formes écrites du langage ne sont apparues que très récemment en Mésopotamie et en Egypte (il y a 5.000 ans environ), avec le surgissement de l’agriculture, la sédentarisation et l’organisation sociale qui en découle : documents comptables (tablettes d’argile), code civil (code d’Hammurabi), récits épiques (textes des pyramides).


D’audacieux explorateurs

Le savant suisse Ferdinand de Saussure (1857-1913), souvent désigné comme le père de la linguistique et de la sémiotique moderne, a insisté sur la relation arbitraire entre le mot (le signifiant) et la chose (le signifié). Le cri d’une vache n’est pas « vache » et la séquence de signes « v a c h e » ne ressemble pas particulièrement à l’animal : il y a donc passage du tangible à l’abstrait (tant à l’oral qu’à l’écrit), puis partage de cette convention entre les interlocuteurs. Ce qui n’est pas peu de chose.

Médecin français, Paul Broca (1824-1880) a le premier identifié l’aire du langage dans le cerveau humain. Un de ses patients (Monsieur Leborgne) atteint d’aphasie profonde était incapable de communiquer (en dehors de l’onomatopée « Tan Tan », qui est devenu son surnom), quoique doté de capacités intellectuelles normales. A son décès, l’examen de son cerveau a mis en évidence une lésion cérébrale dans le cortex frontal inférieur gauche : « l’aire de Broca ». Peu après, le neurologue allemand Carl Wernicke (1848-1905) montre qu’une autre aire du cerveau (« l’aire de Wernicke ») est également impliquée dans la production et la compréhension du langage.

Enfin, dans la seconde partie du XXème siècle, le célèbre linguiste américain Noam Chomsky a proposé l’existence d’une langue primordiale, de laquelle découlerait toutes les autres. Elle serait directement issue de capacités génétiques, et on devrait en retrouver la trace dans les langues actuellement en usage. Cette langue originelle n’a pas encore été découverte, en partie du fait des particularités des langues actuelles qui floutent ces racines communes. Et comme il est probable que plusieurs foyers linguistiques aient émergés simultanément dans le monde, cette question reste particulièrement difficile.


Les enfants sont les vrais magiciens du langage

Le petit enfant acquiert le langage d’une manière intrigante. Dès avant sa naissance, il découvre les sons utiles, transmis par sa mère (littéralement sa « langue maternelle »). Il peaufine progressivement sa capacité à les reconnaître, au détriment des autres (un japonais « n’entend » ni le son « v » ni le son « l » ; de même un « v » espagnol sonne comme un « b » français). Ensuite, l’enfant apprend (découvre ?) par lui même une syntaxe rudimentaire et devient capable de faire des phrases simples. L’acquisition du vocabulaire est un jeu d’enfant : plus de 1.000 mots dès 3 ans !

Ce qui est vraiment surprenant, c’est que cet apprentissage ne passe pas par des « big data », des corpora gigantesques, de l’apprentissage plus ou moins profond… Les enfants apprennent à parler sans livre de grammaire, avec très peu de cycles essais/erreurs. Et pourtant ça marche ! Ce simple constat, à la portée de tous les parents, fait pencher les spécialistes vers l’existence de capacités innées à maîtriser le langage naturel, en complément de l’aspect culturel (les interactions avec l’entourage).

Le passage de la chose (le signifié) à sa représentation abstraite (le signifiant) est déjà un tour de force en soi. La capacité à le faire à l’aide d’une syntaxe flexible, utilisant peu de signes tout en supportant une infinité de formes, en est un autre. Nous avons si bien intégré ces deux aspects que nous n’en sommes plus même conscients.


Puisque le langage naturel fonctionne si bien pour la communication entre « les gens » – pourquoi ne pas s’en inspirer pour faire communiquer les choses, infiniment plus simples et concrètes ?

© 2020 Agora Software - All rights reserved

Follow us:

  • LinkedIn - White Circle
  • Twitter - Cercle blanc