20 de nov. de 2013

Um pouco sobre Fórmulas e Verbos Irregulares

[Eu deveria estar escrevendo meu TCC ou então terminando a implementação de um certo parser que gostaria de entregar amanhã; as circunstâncias do meu psicológico contudo mo impedem -- e o procrastinar se dá através desse blog]

Hoje quero falar de um conceito que me deixou muito interessado enquanto eu estudava sobre os "trabalhos relacionados" do meu TCC: o conceito de fórmula.

Quem o definiu foi um tal de Otto Jespersen, num livro que me pareceu ser bem popular, já que, desde a sua primeira publicação em 1924, foi republicado várias vezes: The Philosophy of Language. No capítulo inicial, "Living Grammar", ele comenta sobre um conjunto de assuntos "abertos" da língua, como como palavras homônimas podem significar coisas distintas, como palavras com o mesmo som podem ser escritas de formas completamente diferentes, e como tem coisas na língua que simplesmente "são", ou seja, que não seguem regra alguma. A essas últimas, ele dá o nome de fórmula. Com suas palavras:

A formula may be a whole sentence or a group of words, or it may be one word, or it may be only part of a word, -- that is not important, but it must always be something which to the actual speech-instinct is a unit which cannot be further analyzed or decomposed in the way a free combination can.

Traduzindo livremente:  Uma fórmula pode ser uma sentença ou um grupo de palavras, ou pode ser uma palavra, ou pode ser somente parte de uma palavra, -- isso não é importante, mas deve ser sempre algo que para o real discurso-instinto é uma unidade que não pode ainda ser analizada ou decomposta da forma como uma combinação livre pode.

O que me é interessante sobre esse assunto é que, para ele, ela não se limita à sintaxe, mas engloba também a fonética. Um exemplo que ele dá são as palavras com sufixo able, que, no surgimento desse sufixo, tendiam a ser "pré-proparoxítonas", como em 'despicable [o apóstrofo indica a sílaba acentuada], 'comparable, 'lamentable e 'preferable. Por acaso, algumas dessas acentuações acabavam caindo justamente na mesma sílaba da acentuação do verbo correspondente:

con'sider --> con'siderable

Com o tempo, a regra "mudou", e cada vez mais os falantes nativos passaram a pôr a acentuação na mesma sílaba onde o verbo é acentuado. Assim,

'acceptable --> ac'ceptable (ac'cept)
'respectable --> re'spectable (re'spect)

, e assim por diante [aliás... pra mim, sílaba em inglês é um negócio que só nativo entende u.u]. Eu quero deixar claro que esse é um exemplo em que a regra pra formação de palavras novas (o que ele chama de "free formations") mudou.

Ter visto esse exemplo me fez pensar num conjunto de verbos em português que, se houve qualquer free formation que levou à sua construção no passado, hoje ela não existe mais -- e só nos sobrou a fórmula. São verbos que seguem a estrutura:


início + a + consoante + segunda_conjugação

que, [ir]regularmente, mudam de raiz no seu meio. Por exemplo:

haver --> eu houve
caber --> eu coube
trazer --> eu trouxe
saber --> eu soube

Apesar do "o" na primeira pessoa do singular do pretérito perfeito do indicativo, eu sempre disse "eu cube". Até pouco tempo atrás, não entendia daonde poderia ter saído isso; mas claramente a regra também se aplica ao verbo saber. Na minha cabeça, a conjugação é:

Eu sube
Tu soubeste
Ele soube

Faço o mesmo com o verbo trazer -- e é daí que sai o famigerado trusce [escolhei a grafia -- eu sempre escrevi assim], por causa dos quais as coleguinhas pseudo-intelectualizadas da escola se fartavam de xingar os outros de burros u.u [eu sempre direi trusce]. Pra mim é "claro" (evidente) que eu extraio essa estrutura de forma "pré-fabricada" da minha cabeça. Eu não aplico qualquer análise: eu trusce pra mim é tão certo (e padrão) quanto eu tive ou eu pus [outras conjugações "sem sentido", mas aceitas].

(Anyways... uma coisa a dizer é que o verbo "haver" já caiu em desuso (ou virou preposição) -- e só aparece quando queremos falar de forma mega-cuidada)

Outro exemplo pra mim super interessante de algo que é definitivamente uma "fórmula" são muitos verbos que seguem o padrão

início + e + consoante + terceira_conjugação
início + o + consoante + terceira_conjugação

que [a esmagadora maioria -- ou ao menos os mais comuns] troca o e/o por i/u em algumas conjugações:

ferir --> eu firo dormir --> eu durmo
sentir --> eu sinto demolir --> eu demulo
mentir --> eu minto engolir --> eu engulo
seguir --> eu sigo cobrir --> eu cubro
progredir --> eu progrido tossir --> eu tusso
refletir --> eu reflito

Pra mim eles são um bom exemplo de fórmula porque me parece que outros verbos menos freqüentes não soam muito bem quanto sofrendo o mesmo tipo de flexão:

gerir --> eu giro
emergir --> eu emirjo
abolir --> eu abulo
polir --> eu pulo
extorquir --> eu exturco
remir --> eu rimo
acodir --> eu acudo

Mais do que isso, ainda tem uns verbos que passam por cima de tudo [fórmula?] e só permitem mudanças depois do radical:

sorrir --> eu sorrio (presente) --> eu sorri (passado)
florir --> eu florio (presente) --> eu flori (passado)  [só eu digo isso?]
rir --> eu rio (presente) --> eu ri (passado)

[aliás... eu digo que as plantas estão floridas -- de onde eu tiro o verbo florir --; mas aceitaria naturalmente também as variações florescidas (florescer) e floreadas (florear)]

Um último conjunto de verbos que é claramente recuperado da nossa memória de forma pré-fabricada são aqueles que constróem a segunda e terceira pessoas do singular do presente do indicativo com "ói[s]":

moer --> ele mói
doer --> ele/isso dói
construir --> ele constrói
destruir --> ele destrói

[coloque-se o verbo poer --> põe nesse grupo, diga-se de passagem. Fico pensando: se esses verbos tivessem evoluído junto com o põe, talvez tivéssemos um conjunto de verbos da quarta conjugação completamente vivo e produtivo]

Bom... eu tenho mais um monte (um monte MESMO) de anotações sobre verbos irregulares presentes na nossa língua de que a gente simplesmente não se dá conta. Essas expressões não-livres me são interessantes porque freqüentemente não aparecem sozinhas: cada vez mais me convenço do quão raro é que uma irregularidade aconteça com somente uma palavra. Fico pensando em quão legal seria "regularizar" essas exceções... ou ainda torná-las produtivas de volta.

Enfim... eu preciso parar de procrastinar though... já perdi tempo demais por aqui hoje.

R$

-----------------
Edit: no início eu pensei que estivesse escrevendo bobagem, e no fim acabei removendo uma parte da postagem original, a qual, agora, depois de um pouco melhor pensar, resolvi, merece voltar:

Existe um conjunto de verbos que segue o caminho oposto ao conjunto início + o + consoante + terceira_conjugação. São verbos na estrutura

início + u + consoante + terceira_conjugação

que, na segunda e terceira pessoas do singular trocam o u por o. É como se eles antigamente fossem com "o" (é que eles seguem a mesma regra que "tossir", por exemplo) ou algo assim xP [aliás, minha suposição é de que eles "formem conjunto" com os que terminam em ói ali em cima -- a idéia é a mesma, só que lá em cima não tinha uma consoante pra "enrigecer" o som como aqui]. Assim, enquanto alguns verbos nesse formato não trocam vogal alguma

punir --> ele pune
curtir --> ele curte
grunir --> ele grune
ebulir --> ele ebule [se diz isso?]

, alguns outros realizam essa estranha troca:

zumbir --> ele zombe
fugir --> ele foge
cuspir --> ele cospe
sumir --> ele some
acudir --> ele acode


A minha conclusão é que, apesar de os verbos da terceira conjugação serem bem "chatos" de conjugar -- ou seja, seguirem regras muito frouxas --, errar aqui não torna o verbo difícil de entender (para o deleite dos não-nativos xP -- apesar de que, me parece, é justamente aqui que eles se "denunciam" quando falando português).

R$

19 de nov. de 2013

Expressões Multipalavras

Nos últimos 10 meses or so, eu venho trabalhando, no grupo de Processamento de Linguagem Natural, com um tópico que, se não se demonstra o meu maior interesse quando o assunto é lingüística, pelo menos se tornou um "assunto amigo" sobre que me é interessante conversar: Expressões Multipalavras.

O leitor deve [ou não] ter notado os [até que] freqüentes [demais] grifos no parágrafo anterior. Todos eles são exemplos -- em níveis diferentes de "rigidez" -- desse fenômeno recorrente através das línguas do mundo. Inclusive o próprio nome: "Multiword Expression", em inglês. Os grifos prosseguirão ao longo dessa postagem, evidenciando (ou, como eu gostaria de dizer, "evendo") o quão comum é essa classe. Aliás... eu poderia grifar até mais do que o faço; mas haveria discordantes, talvez, sobre se um grupo de palavras faz ou não parte de tal conjunto.

De fato... não precisamos ir muito longe: o motivo que me levou a escrever essa postagem foi que eu disse que a perícia médica deveria ter recomendado o uso de óleo de peroba, de 12 em 12 horas, pelo José Genoíno, tamanha a sua cara de pau.

Aí talvez o leitor se pergunte: mas por que diabos [sério... eu não to forçando o uso dessas expressões ] é que se usam essas expressões? Ou seja... como é que a língua "evolui" de forma a, com o tempo, desenvolver esses conjuntos "semi-fixos" de palavras? A resposta é grande, mas em sua versão resumida se limita a "não sei" [só sei que foi assim].

O que eu sim sei é que isso já ocorre desde línguas muito antigas -- e muitíssimas das nossas palavras de hoje são decorrentes desse tipo de coisa.

Quando eu comecei a escrever meu TCC, eu tinha alguns artigos através dos quais eu me baseava e aos quais eu gostaria de fazer referência na seção de "trabalhos relacionados". Como eu me sentia inseguro de referir sem muito conhecimento, comecei a ler freneticamente vários artigos, vários dos quais referiam outros artigos. É óbvio que nisso eu acabei caindo numa toca de coelho ("rabbit hole" -- parece que se tem usado essa expressão na internet ultimamente): referências referiam outras referências, num loop infinito do qual eu só conseguia fugir quando não era capaz de encontrar certo livro na internet.

Bom... o resultado foi que, no fim das contas, eu li até que bastante sobre as diferentes áreas que estudaram esse fenômeno. Por exemplo, um pessoal do leste europeu começou uns estudos sobre uma tal de "fraseologia", por exemplo, que engloba boa parte do que hoje chamam de expressões multipalavra; um outro cara chamado Otto Jespersen definiu a palavra "formula" pra se referir a tudo o que é "retrieved as a whole" (recuperado "como um inteiro") pela nossa memória durante a fala, em vez de dependente das regras da gramática [sintática- ou fonologicamente]  -- e aí várias pessoas passaram a usar termos como "prefabs", "formulaic language" (língua formuláica) e "formulaic sequence" (sequência formuláica) para se referir a esses fenômenos.

Mais um grifo... dessa vez do Dragon Quest xP


Enfim... esse é simplesmente o primeiro, o mais simples, mais introdutório, e provavelmente menos direto texto meu sobre esse assunto. Já deu pra perceber, pelos grifos do meu texto, expressões multipalavras são coisa recorrente, tanto na nossa fala quanto na nossa escrita. De fato, tem um tal de Ray Jackendoff que chegou a estimar que elas compõem cerca de 50% do nosso vocabulário nativo (diga-se de passagem, alguns outros caras defendem que são justamente essas "expressões formulaicas" que denunciam os falantes não-nativos de que eles não o são), e eu acredito nele: apesar de certamente mais de 50% do total deste texto não serem grifos, tem muitas expressões mais que poderiam estar grifadas. É o caso dos superlativos no início desse parágrafo, por exemplo. Afinal, em português, constróem-se os superlativos através da formação "artigo + mais + adjetivo", formação essa composta por mais de uma palavra. E o que falar sobre os verbos que exigem preposição? E os reflexivos? E os nomes de pessoas? [o Jackendoff os contava]

Não importam muito, na verdade, quais são os limites que definem quando uma construção "entra como" uma expressão multipalavra ou não. O que importa, no momento, é que elas existem... que são freqüentes demais para serem ignoradas, ao passo em que, na verdade, elas o são.

Enfim... eras isso...

Próximas postagens deverão focar em assuntos mais bem definidos e [quem sabe?] mais interessantes xP

R$

16 de nov. de 2013

Quick update

[sério: eu pensei eu nomear essa postagem com alguma coisa como "rápida sobredata" ou coisa do gênero, mas achei que ficaria forçado demais xP]

Bom... já sabeis o que direi: que ando meio "sem tempo" [i.e., com outras prioridades, ou coisa do gênero] e que por isso acabei ficando sem postar no blog. É bem isso mesmo.

Na real, estou a mais ou menos duas semanas de terminar o meu TCC (e, com isso, basicamente, terminar o meu curso inteiro \o/) e tenho perdido muito tempo escrevendo. O tempo livre dos últimos dias tem tentado (nem sempre conseguido) ser completamente dedicado a dormir ou/e (porque eu fico insistentemente sonhando com isso) fazer coisas relacionadas a meu TCC.

Com a escrita, acabei encontrando uma série de "trabalhos relacionados" (muitos deles acabaram virando referências na seção de "embasamento teórico" sobre o assunto) que me pareceram muito interessantes. Por isso, estou pretendendo construir, nos próximos tempos, uma série sobre expressões multipalavra, já que esse é o foco do meu trabalho.

É claro que ainda vou acabar escrevendo um monte de coisas loucas que eu andei notando nos últimos tempos sobre latim. Para aqueles de vós leitores que convivem comigo frequentemente, admita-se que não haverá muita surpresa: só um monte de coisas sobre etimologia que eu andei notando nos últimos tempos; espero surpreender -- ou, pelo menos, deixar feliz -- aqueles outros de vós que não me vêem com tanta freqüência.

Que mais? Queria ter posto uma imagenzinha aqui, e falado sobre como várias coisas aleatórias de línguas que sem motivo eu aprendo são legais... mas... infelizmente... por agora... é só o quick update.

É isso...

R$