Águia, ferramenta de procura em árvores

logo temporário da FS
Projecto Floresta sintá(c)tica

Search interface in English


Escolha do corpus

Bosque (versão 7.3, de 22 de Dezembro de 2005): 9.431 árvores revistas, correspondendo a 1962 extractos, 9.368 frases distintas, 215.003 unidades, aprox. 184.773 palavras
Floresta Virgem (versão 2.0, de 16 de Março de 2005): 78.246 árvores, correspondendo aproximadamente a dois milhões de palavras, criadas automaticamente a partir do resultado da análise do PALAVRAS do primeiro milhão de palavras do CETEMPúblico e do CETENFolha. Nota: A Floresta Virgem inclui as frases que constituem o Bosque, antes da sua revisão.

Tipo de resultado:
Concordância
Distribuição dos lemas
Distribuição da categoria gramatical
Distribuição das funções das palavras
Distribuição dos sintagmas
Distribuição dos sintagmas constituintes imediatos
Distribuição das funções dos sintagmas
Distribuição das funções dos constituintes imediatos
Distribuição do texto
Distribuição do tamanho

Exprima aqui o seu pedido:

Forma de procura

A sintaxe da procura ainda se encontra numa fase muito pouco amigável. Em princípio, é uma extensão do projecto AC/DC, o que significa que a sintaxe (IMS-CWB) usada neste também se aplica à Floresta. Contudo, os nomes dos atributos e dos valores são um pouco diferentes. Por exemplo, em vez de pos="N", será pos="n"; em vez dos atributos genero, temcagr e numpess, há apenas o atributo morf...

Neste momento, existe apenas uma visita guiada bastante desactualizada, e só cobrindo as extensões, em inglês. Sugerimos que use uma forma semelhante aos exemplos apresentados em seguida para obter os seus objectivos, e experimente, através das funções de distribuição, que valores é lícito esperar.

Pedido de concordâncias

Pedido de distribuição

Esta procura é feita fisicamente sobre um outro corpus, cujos elementos terminais são os sintagmas. O tipo de expressões a procurar será pois da forma "np" ou [funcao="ACC"], e o tipo de resultados será escolhido através do pedido de distribuição acima.

Por exemplo, para ver que tipos de sujeitos sintagmáticos existem na floresta em relação aos seus constituintes, selecciona-se "distribuição dos sintagmas" acima, usando a expressão de procura [funcao="SUBJ"]. Obter-se-ia a distribuição em termos de número de palavras se fosse escolhida a "distribuição de tamanho".

Por outro lado, para ver que funções desempenham os sintagmas preposicionais na Floresta, basta seleccionar "distribuição da função" e simplesmente digitar "pp" na janela do pedido. Para ver quais as palavras que constituem o PP, escolher-se-ia a "distribuição de texto".

Ainda por implementar

Dados quantitativos globais, relativos ao Bosque

orações21.931
finitas15.566
infinitivas5.602
averbais763
sintagmas nominais43.096
sintagmas preposicionais32.210
sintagmas adjectivais1.780
sintagmas adverbiais833
itens coordenados5.448
árvores9.431
frases com duas ou mais árvores64
frases com exactamente duas árvores61
frases com exactamente três árvores2

Última actualização: 22 de Agosto de 2006.
Comentários, sugestões e perguntas sobre a Floresta Sintá(c)tica