Hora de farmar: Coletando o Corpus

Atualmente estou no processo de coleta do corpus. Essa parte não é uma das mais emocionantes na pesquisa, principalmente pelo fato de que a maior parte da coleta está sendo manual. Os textos dos jogos estão sendo coletados de várias fontes, como wikis, fan sites, fóruns, arquivos dos jogos e transcrições. A principal preocupação no momento é certificar que os textos estão corretos e criar marcações e legendas pra facilitar o processo de limpeza do corpus no futuro. 

Leave a Reply

Your email address will not be published. Required fields are marked *

en_USEN
Portal da Ciência Aberta