Bom dia! e bem-vindas e bem-vindos a versão escrita de mais um Spin de notícias, o seu giro diário de informações científicas… em escala subatômica. Hoje vamos falar de tretaaaaa, quer dizer de Linguística de corpus legal e mais um comprimido efervecente de gramática

Shiu shiu shiu shiu Spin de notícias!

Bom vamos começar com o artigo do Kevin Tobia no blog da universidade de Direito de Chicago (link). Neste post Kevin traz uma treta que muito me interessou. Não só porque eu adoro ouvir uma fofoca, mas porque tem tudo a ver com o que estou estudando. Como toda fofoca, vou começar com:

“Ao que parece”, os juizes nos Estados Unidos descobriram a Linguística de corpus. Se você não sabe do que eu estou falando, não preocupa porque vou dar uma explicada rápida, mas se quiser saber mais, eu fiz um Spin só sobre isso, o 959 (link).

Existem hoje alguns softwares de Linguística de Corpus que são bem interessantes. Você alimenta ele com um texto e ele é capaz de te dizer quais são as palavras usadas mais frequentemente; como uma determinada palavra se relaciona com outras que estão por perto; é ainda capaz de te mostrar todas as ocorrências de uma palavra com um pouquinho de contexto pra cada lado. Dependendo do software e dos corpus que ele já tenha enterrado la dentro… ops… Dependendo do material que ele já tenha catalogado, ele é capaz de te mostrar o que diferencia o seu texto desses outros textos no catálogo dele.

Enfim, voltando à treta. Há 10 anos um cara chamado Stephen C. Mouritsen publicou uma nota falando que a linguística de corpus poderia ser uma ferramenta nova para interpretação legal (de direito, não tipo gente boa – bad joke!). Outro cara, Lawrence Solum, chegou a dizer que “a linguística de corpus vai revolucionar a interpretação legal e constitucional”.

O artigo segue explicando o que eles agora já estão chamando de linguística de corpus legal e traz alguns exemplos de como essa ferramenta já foi usada em decisões nos Estados Unidos. Eu trouxe uma para exemplificar para vocês (link). Não quero entrar em detalhes de tradução, mas essa é uma opinion, caso você, ouvinte, saiba a distinção entre os tipos de decisão nos Estados Unidos. Eu estou chamando de decisão porque, em português é o termo mais amplo e não dou um furo de dizer um nome errado, caso seja um termo mais específico.

Essa é uma decisão do estado de Utah de apelação sobre uma adoção. O pai biológico da criança queria usar um estatuto federal como argumento para burlar alguns requisitos e anular o que é já jurisprudência no estado quanto a procedimentos de adoção. Essa apelação do pai biológico se baseia na expressão “procedimentos de custódia”, usada no estatuto federal e que ele queria que fosse aplicada no estado. Lembrando que nos Estados Unidos estados podem ter entendimentos diferentes uns dos outros sobre temas (como é o caso da descriminalização do aborto, e até da sentença de morte – ainda aplicada em 29 estados).

Enfim, a juiza usa métodos de linguística de corpus para sustentar que o termo “procedimento de custódia” é, na verdade usado para tratar de questões relacioadas a divorcio e não e não à adoção. O argumento foi o seguinte: das 500 frases que ela analisou, tiradas de forma randomizada de um corpus que visa a compilar o inglês americano em uso, ela encontrou que 202 usos do termo estavam relacionados ao direito penal; 146 explicitamente se referiam a divórcio enquanto 71 se referiam a ações de proteção a menores; só 12 das 500 frases se referiam a adoção.

O link da decisão está aí para quem quiser ver mais detalhadamente o argumento da juiza. A ideia era só dar um exemplo para chegarmos finalmente à treta: como determinar o que é o significado mais comum de uma palavra? Alguns juizes e teórios do direito, que o Kevin vai chamar de “entusiastas de corpus” dizem que a linguística de corpus é a melhor ferramenta para determinar isso. Outros, que ele chama de “céticos de corpus”, levantam os vários problemas já conhecidos dentro da área da linguísitca em linguistica de corpus: que um corpus pode mostrar padrões, mas que a coleta de dados para fazer os corpus pode em si ter viés; que há um problema de descontextualização da palavra; e que tudo isso nos diria absolutamente nada sobre o significado das palavras. Kevin ainda descreve os “moderados de corpus”, que acreditam que há alguma forma de uma boa linguística de corpus dar alguma evidência de significados comuns.

O artigo traz, então, os padrões do que seria uma boa linguística de corpus legal. E todos os pontos são questões discutidas a exaustão dentro da linguística como: a construção de corpora mais expecíficos, que possam efetivamente representar o que se está pesquisando e que sejam devidamente equilibrados; e a questão de levar o contexto em consideração. O texto ainda traz vários links que trazem as críticas a esse uso da linguística de corpus nas decisões judiciais e dados bem interessantes. Por exemplo, o aumento do uso de linguística de corpus nas decisões de 2011 pra cá; que ministros da suprema corte indicados por presidentes republicanos usam mais a linguística de corpus do que qualquer outro, incluindo juízes de outras instâncias.

O artigo é bem interessante.

Vamos agora para o comprimido efervescente?

Plosh plum shhhhhhhhhhh

O André Trapani minha fonte inesgotável de temas para o comprimido efervescente, pediu que eu falasse um pouco sobre o uso do ponto e vírgula. Minha resposta rápida é: não usem.

Se sua sentença está muito longa e você acha que precisa de um ponto e vírgula para continua-la, minha sugestão é repense sua sentença. Sentenças longas como essas costumam ficar confusas e dão margem para que “escrevamos como pensamos”, ou seja, sem estrutura.

Há sim casos em que ponto e vírgula são usados e são úteis. Eu mesma usei algumas vezes nesse texto. Quanto temos uma lista de coisas, mas essas coisas são frases longas, aí o ponto e vírgula entram em ação.

Veja um exemplo em que eu  os usei:

“Outros, que ele chama de “céticos de corpus”, levantam os vários problemas já conhecidos dentro da área da linguísitca em linguistica de corpus: que um corpus pode mostrar padrões, mas que a coleta de dados para fazer os corpus pode em si ter viés; que há um problema de descontextualização da palavra; e que tudo isso nos diria absolutamente nada sobre o significado das palavras.”

Os itens da minha lista eram muito longos, então, para conseguir deixar claro, separei os itens com ponto e vírgula.

P-p-p-por hoje é só, p-pessoal! Lembro que todos os links comentados estão no post e deixe lá também seu comentário, elogio, crítica, declaração de amor ou sugestão de comprimido que queiram que eu dissolva. Lembro ainda que esse podcast só é possível acontecer por conta de seu apoio no patronato do SciCast, no Patreon, no Padrim ou PICPAY.