Ciência

Sabia que a sua “aquisição da linguagem pré-adulta” cabe numa disquete 1,44 MB?

13 Comentários

Há estudos muito interessantes que convertem determinada informação em “medidas” que podemos facilmente entender. Segundo uma investigação, os humanos armazenam cerca de 1,5 megabytes de informação durante a aquisição da linguagem.

Desta forma, uma disquete de 1,44 MB chegava para guardar muito do que aprendemos até à idade adulta.

Informação recolhida da aprendizagem da linguagem pré-adulta cabe numa disquete


Tudo o que aprendemos até à idade adulta cabe numa disquete

Com a evolução da tecnologia e de conceitos relacionados com o ser humano, é possível fazer certas comparações. Entre essas comparações estão as feitas entre os mundos da ciência e da informática.

Nesse sentido, investigadores americanos calcularam que, da infância à idade adulta jovem, os aprendizes absorvem aproximadamente 12,5 milhões de bits de informação sobre a linguagem. São cerca de dois bits por minuto para adquirir plenamente o conhecimento linguístico.

Quando estes dados são convertidos em código binário, o espaço necessário para os armazenar é o de uma disquete de 1,5 MB (1,44 MB), segundo o estudo.

 

Tão pouco? Isso será fácil ensinar a um robô

As informações publicadas no site da Royal Society Open Science desafiam as suposições de que a aquisição da linguagem humana acontece sem esforço e que os robôs teriam facilidade em dominá-la.

O nosso estudo é o primeiro a colocar um número na quantidade que [os seres humanos] têm que aprender para adquirir a linguagem.

Isso destaca que as crianças e os adolescentes são alunos incríveis, absorvendo mais de 1 000 bits de informação por dia.

Explicou o principal autor do estudo, Steven Piantadosi, professor assistente de psicologia na Universidade da Califórnia, em Berkele.

Por exemplo, ao aprender a palavra “peru”, um jovem aprendiz normalmente recolhe informações perguntando: “Um peru é um pássaro? Sim ou não? Um peru voa? Sim ou não?” E assim por diante, até compreender o significado completo da palavra “peru”.

 

O bit como unidade de comparação da aprendizagem humana

Em grosso modo, um bit, ou dígito binário, é uma unidade básica de dados na computação. Os computadores armazenam informações e fazem cálculos usando apenas zeros e uns. Assim, o estudo usa a definição padrão de oito bits para um byte.

Quando pensamos numa criança a ter que se lembrar milhões de zeros e uns (na linguagem), isso significa que eles devem ter mecanismos de aprendizagem realmente impressionantes.

Refre Piantadosi.

Na investigação, os especialistas procuraram avaliar as quantidades e os diferentes tipos de informação que os falantes de inglês precisam para aprender a sua língua nativa. Posteriormente, chegaram aos resultados executando vários cálculos sobre semântica e sintaxe de linguagem recorrendo a modelos computacionais. Surpreendentemente, o estudo constata que o conhecimento linguístico se concentra principalmente no significado das palavras, em oposição à gramática da linguagem.

 

Mas será fácil os robôs aprenderem ou afinal é mesmo complicado?

Os investigadores referem que muitas pesquisas sobre aprendizagem de idiomas concentram-se em sintaxe, como ordem de palavras. No estudo liderado por Piantadosi, foi mostrado que a sintaxe representa apenas uma pequena parte da aprendizagem da língua, e que a principal dificuldade é aprender o que tantas palavras significam.

Desta forma, o foco na semântica versus sintaxe distingue humanos de robôs. Além disso, esta metodologia também se aplica a ajudantes digitais controlados por voz, como Alexa, Siri e Google Assistant.

Isso realmente destaca a diferença entre aprendizagem de máquinas e aprendizes humanos. As máquinas sabem que as palavras andam juntas e para onde vão em frases, mas sabem muito pouco sobre o significado das palavras.

Referiu Steven Piantadosi.

Quanto à questão de se as pessoas bilingues devem armazenar o dobro da informação, Piantadosi diz que isso é improvável no caso de significados de palavras, muitos dos quais são partilhados entre os idiomas.

Os significados de muitos nomes comuns, como ‘mãe’, serão semelhantes entre os idiomas. Portanto, não precisamos de aprender todas as informações sobre os seus significados duas vezes.

Concluiu o investigador.

Autor: Vítor M.
Partilhar:
Também pode gostar

Comentários

13

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

  1. Avatar de Marco
    Marco

    E quando o nosso cerebro tem a memoria cheia é possivel desfragmentar ou formatar alguma partição? Quem sabe o segredo para o Alzeimer não está em trocar a disquete por um ssd.

  2. Avatar de Luís Silva
    Luís Silva

    🙂 Bem agora só falta, mesmo, pôr umas lentes de leitura ótica ligadas aos neurónios e abrir uma ranhura na cabeça, para enfiar um CD com a enciclopédia. 🙂
    Diria : melhor seria pôr um modem ligado aos miolos e ter acesso à internet!

  3. Avatar de Joselito
    Joselito

    Ah tá… Conta outra…

  4. Avatar de Asdrubal
    Asdrubal

    Acho que a informação da minha linguagem já adulta deve caber numa disquete de 5″1/4.

  5. Avatar de ToFerreira
    ToFerreira

    Primeiro, “Tudo o que aprendemos até à idade adulta” não é apenas a linguagem. Segundo, a linguagem está interligada com praticamente tudo o resto da aprendizagem, não faz sentido separá-la. Por último, tirando a alta questionabilidade da conversão dos dados, a análise de linguagem natural é muito difícil precisamente por tudo o que esta envolve.

    1. Avatar de Vítor M.

      No foco, como diz no texto e no estudo, está a aquisição la linguagem.

      1. Avatar de Miguel Silva
        Miguel Silva

        Mas se separarmos as coisas, provavelmente os 1,5MB de informação só é suficiente para papaguear uma língua sem consciência do que a referida frase representa.
        Imaginem um papagaio com um microSD de 128GB 😛
        BTW, os perus voam?

        1. Avatar de Vítor M.

          Então afirmas que a haver um problema é no suporte de armazenamento? Não é dito que existe uma limitação no suporte.

      2. Avatar de Devsys
        Devsys

        Não sei se será assim. Acho muito interessante esta área, apesar de ser um mero curioso. Neste caso, “medir” o “tamanho” da informação é possível, como ilustra o texto e é sabido desde há muito.
        Mas aqui há vários prismas para ver o mesmo assunto. Do ponto de vista da “medida” de cada palavra, em que a palavra sopa irá ter o mesmo tamanho de soma.
        No entanto, quem já teve filhos, reparou que aos 2/3 anos, eles já sabem o que é uma sopa, sabem para que serve e alguns choram por ela (outros porque não a querem comer).
        Já se fizermos a experiência de andar de volta do miúdo a tentar ensinar a soma, não vai acontecer a essas idades.
        Portanto, só por aqui se tira que palavras que ocupam o mesmo número de bits, têm processos muito diferentes depois na formulação do pensamento. A construção cerebral do conhecimento, mesmo o da linguagem, está assente nas relações que o cérebro opera sobre todos os inputs que tem dos diversos sentidos, quer audição, quer visão e por aí fora.
        Quando um pai ensina a soma ao filho, certamente usa dois brinquedos, ensina a contar, o miúdo vê um brinquedo e ouve a palavra um, depois vê outro brinquedo e ouve a palavra dois, e oi pai diz que 1+1 dá 2. Eu imagino que o cérebro não guarde isso de forma literal (até porque era muito ineficiente e era a forma menos optimizada de o fazer).
        O processamento da linguagem natural, é altamente complexa, não decorre da medida em bits das palavras, são as relações das palavras e as abstrações que essas relações criam é que são complexas.
        A publicação não explica, porque não foi esse o âmbito, de como medir as relações, até porque nunca li que alguém já tenha proposto algum tipo de formulação nesse sentido. O que nós todos já conhecemos das redes neuronais (no mundo da computação), são não correspondem exactamente ao funcionamento do cérebro humano, e mesmo nestas, feitas por nós, dependendo da rede, pode ser praticamente impossível sequer arranjar algum tipo de “razão” sobre o comportamento da mesma, muito menos sequer “medir” qualquer tipo de relação.
        Aqui “medir” uma relação não é no sentido estrito, relações não se mexem aos “metros”, medir aqui é no sentido de arranjar uma forma de poder comparar relações a poder afirmar alguma coisa sobre isso.

        Como exemplo visual da minha conversa (longa), já toda a gente leu uma frase de uma ou duas linhas, sabia o significado de cada palavra, mas não percebeu nada do que leu, e demorou tempo até perceber o total “alcance” da frase.

        1. Avatar de Vítor M.

          Claramente há métodos que são usados para poderem afirmar que existe uma medida. Fiquei mais curioso na questão do bilingue.

  6. Avatar de Paulo Silva
    Paulo Silva

    Quando li o titulo, pensei que iam falar do Paradise Café !!

  7. Avatar de BAITES
    BAITES

    Esses dados do cérebro na disquete são comprimidos em ARJ?

    1. Avatar de Palma Ferreira
      Palma Ferreira

      ARJ de MS-DOS não… nos dias que correm só se for em WINARJ ou WINRAR… os miúdos de hoje, de uma forma geral, já não sabem trabalhar em CLI… só mesmo por GUI… LLLLOOOOOLLLLLL