{"id":1510,"date":"2022-09-20T16:54:33","date_gmt":"2022-09-20T16:54:33","guid":{"rendered":"https:\/\/cienciaaberta.org\/?p=1510"},"modified":"2023-04-20T17:32:13","modified_gmt":"2023-04-20T17:32:13","slug":"e-hora-da-coleta","status":"publish","type":"post","link":"https:\/\/cienciaaberta.org\/en\/2022\/09\/20\/e-hora-da-coleta\/","title":{"rendered":"Coleta seletiva"},"content":{"rendered":"<p>Que rufem os tambores, ladies and gentlemen!!!! Vou contar para voc\u00eas o processo, a metodologia para a coleta do meu corpus. Primeiramente, decidimos coletar tweets que tivessem a palavra &#8220;sustentabilidade&#8221; e n\u00e3o apenas os que tivessem #sustentabilidade para deixar o resultado mais amplo. O corte temporal, como j\u00e1 disse por aqui, foi de 2018 a 2022. Vou contar para voc\u00eas, de forma extremamente simplificada e resumida \u2013 sem spoilers porque quero que voc\u00eas leiam depois a minha disserta\u00e7\u00e3o \ud83d\ude09 \u2013 o processo de coleta e an\u00e1lise fatorial do meu corpus. Fazendo uma analogia, essa \u00e9 a hora que jogamos a rede para pescar as informa\u00e7\u00f5es. Essa coleta \u00e9 feita via ferramenta snscrape e resultou no total de 93.689 tweets, com 2,8 milh\u00f5es palavras. O corpus \u00e9 processado e etiquetado, de forma autom\u00e1tica, pelo TreeTagger (para portugu\u00eas). A\u00ed \u00e9 feita tamb\u00e9m uma checagem manual, separando o que realmente \u00e9 peixe dentro do que foi colhido pela \u201crede\u201d que falamos. Deixamos os substantivos, verbos, adjetivos. As hashtags tamb\u00e9m entraram, porque, sob nossa \u00f3tica, t\u00eam um grande valor discursivo, como explicarei na minha disserta\u00e7\u00e3o. A etiquetagem das hashtags foi realizada por um script desenvolvido por Berber Sardinha. Os lemas contados e organizados em planilhas. Por crit\u00e9rio de frequ\u00eancia, foram selecionadas 500 var\u00e1veis lexicais para a an\u00e1lise fatorial. Pr\u00f3ximo passo eu conto no pr\u00f3ximo post. \ud83d\ude09<\/p>","protected":false},"excerpt":{"rendered":"<p>Que rufem os tambores, ladies and gentlemen!!!! Vou contar para voc\u00eas o processo, a metodologia para a coleta do meu [&hellip;]<\/p>","protected":false},"author":3,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0,"footnotes":""},"categories":[1],"tags":[],"class_list":["post-1510","post","type-post","status-publish","format-standard","hentry","category-uncategorized"],"jetpack_featured_media_url":"","_links":{"self":[{"href":"https:\/\/cienciaaberta.org\/en\/wp-json\/wp\/v2\/posts\/1510","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/cienciaaberta.org\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/cienciaaberta.org\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/cienciaaberta.org\/en\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/cienciaaberta.org\/en\/wp-json\/wp\/v2\/comments?post=1510"}],"version-history":[{"count":2,"href":"https:\/\/cienciaaberta.org\/en\/wp-json\/wp\/v2\/posts\/1510\/revisions"}],"predecessor-version":[{"id":1512,"href":"https:\/\/cienciaaberta.org\/en\/wp-json\/wp\/v2\/posts\/1510\/revisions\/1512"}],"wp:attachment":[{"href":"https:\/\/cienciaaberta.org\/en\/wp-json\/wp\/v2\/media?parent=1510"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/cienciaaberta.org\/en\/wp-json\/wp\/v2\/categories?post=1510"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/cienciaaberta.org\/en\/wp-json\/wp\/v2\/tags?post=1510"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}