O Pão Que o Viado Amassou: semiotic contribution to natural language processing
DOI:
https://doi.org/10.11606/issn.1980-4016.esse.2022.198626Keywords:
Natural language processing, Data mining, Artificial intelligence, Greimassian Semiotics , Social networksAbstract
The growing production of data on the internet and digital social networks is unavoidable and, by 2025, humanity is expected to produce 463 exabytes of data per day. The size of such a value can be illustrated with the image of approximately half a trillion of 1 gigabyte flash drives. This phenomenon, however, far from being a cause for celebration (as Big Tech wants), has been directly responsible for countless evils to society and democracy: hate speech and disinformation are just the tip of the iceberg. Due to this alarming scenario, conducting research on the intersection between Semiotics and data processing technologies is urgent. In this paper, we intend to briefly present the scenario of one of the most celebrated areas of Artificial Intelligence (characterized by artificial neural networks) and then use the concepts of situational context and discursive competence to debate the mechanisms of signaling biased discourses, used to mark digital publications with the potential for disinformation or hate speech. An iconic case that we intend to focus on, O pão que o viado amassou is a delivery from Curitiba, created by a good-natured gay man, who was penalized by Facebook.
Downloads
References
ARNOLD, Madeleine. La machine molle de W. S. Burroughs : étude sémiotique assistée par ordinateur des structures narratives du roman (Doctorat en Linguistique). 521 p. Mémoire ou thèse - Université de Paris VIII, Paris, 1978.
ARNOLD, Madeleine. La machine molle de W. S. Burroughs: étude sémiotique assistée par ordinateur des structures narratives du roman. In: BORBÉ, Tasso (ed.). Semiotics Unfolding: Proceedings of The Second Congress of the International Association for Semiotics Studies Vienna, 1979. Berlin: De Gruyter Mouton, 1984. p. 713-720.
ARNOLD, Madeleine. Report on the Semiotics and Artificial Intelligence Workshop (Paris, France). In: SEBEOK, Thomas; UMIKER-SEBEOK, Jean (Ed). The Semiotic Web, 1987. Berlin: De Gruyter Mouton, 1988. p. 667–700. Disponível em: degruyter.com/document/doi/10.1515/9783110868388.667/html. Acesso em: 31 maio 2022.
ARNOLD, Madeleine. La sémiotique: un instrument pour la représentation des connaissances en intelligence artificielle. Études littéraires, Montréal, v. 21, n. 3, p. 81-90, 1989. Disponível em: https://doi.org/10.7202/500872ar. Acesso em: 31 maio 2022.
BARROS, Diana Luz Pessoa de. Uma reflexão semiótica sobre a "exterioridade" discursiva. Alfa: Revista de Linguística, São Paulo, v. 53, n. 2, p. 351-364, [on-line], 2009. Disponível em: https://periodicos.fclar.unesp.br/alfa/article/view/2120. Acesso em: 31 maio 2022.
BEIVIDAS, Waldir. Epistemologia discursiva: a semiologia de Saussure e a semiótica de Greimas como terceira via do conhecimento. São Paulo: FFLCH/USP, 2020. E-book. 321 p. Disponível em: https://doi.org/10.11606/9786587621203. Acesso em: 31 maio 2022.
BERTRAND, Denis. Caminhos da semiótica literária. Bauru, SP: EDUSC, 2003.
BRAGA, Antonio de Pádua; LUDERMIR, Teresa Bernarda; CARVALHO, André Carlos Ponce de Leon Ferreira. Redes neurais artificiais: teoria e aplicações. São Paulo: LTC, 2000.
BULAO, Jacquelyn. How Much Data Is Created Every Day? Techjury, Pragua [on-line], 24 jun. 2020. Disponível em: https://techjury.net/blog/how-much-data-is-created-every-day/. Acesso em: 31 maio 2022.
CASTANHO, Fábio; BRAGANÇA, Rafael. Post otimista sobre vacinas omite 2ª dose e confunde previsão com realidade. Uol, São Paulo [on-line], 23 mar. 2021. Disponível em> https://noticias.uol.com.br/confere/ultimas-noticias/2021/03/23/post-otimista-sobre vacinas-omite-2-dose-e-confunde-previsao-com-realidade.htm. Acesso em: 31 maio 2022.
FIORIN, José Luiz. As figuras de pensamento: estratégia do enunciador para persuadir o enunciatário. Alfa: Revista de linguística, São Paulo, v. 32, p.53-67, 2001. Disponível em: https://periodicos.fclar.unesp.br/alfa/article/view/3798. Acesso em: 31 maio 2022.
FIORIN, José Luiz. A festa do discurso: discurso e contexto sócio-histórico. Entrepalavras, Fortaleza, v. 10, n. esp., p. 12-26, mai. 2020. Disponível em: https://doi.org/10.22168/2237-6321-7esp1800. Acesso em: 31 maio 2022.
GÉRON, Aurélien. Mãos à Obra: Aprendizado de Máquina com Scikit-Learn, Keras & TensorFlow. Rio de Janeiro: Alta Books, 2021.
GOODFELLOW, Ian; BENGIO, Yoshua; COURVILLE, Aaron. Deep learning. Cambridge: The MIT Press, 2016. Disponível em: https://www.deeplearningbook.org/. Acesso em: 31 maio 2022.
GREIMAS, Algirdas Julien. Semiótica e ciências sociais. Tradução: Álvaro Lorencini e Sandra Nitrini. São Paulo: Cultrix, 1981 [1976].
JURAFSKY, Daniel; MARTIN, James. Speech and Language Processing: an Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. [S. l.: s. n.], 2022. Rascunho da 3a. ed. Disponível em: https://web.stanford.edu/~jurafsky/slp3/ed3book_jan122022.pdf. Acesso em: 31 maio 2022.
LOPES, Émerson; CORREA, Ulisses; FREITAS, Larissa. Exploring BERT for Aspect Extraction in Portuguese Language. The International FLAIRS Conference Proceedings, [S. l.], v. 34, 2021. Disponível em: https://doi.org/10.32473/flairs.v34i1.128357. Acesso em: 31 maio 2022.
PRISCO, Luiz. O pão que o viado amassou: padaria delivery vende pães e cultura gay. Metrópoles, Distrito Federal [on-line], 16 jun. 2020. Disponível em: https://www.metropoles.com/gastronomia/o-pao-que-o-viado-amassou-padaria-delivery vende-paes-e-cultura-gay. Acesso em: 31 maio 2022.
ROTHMAN, Denis. Transformers for Natural Language Processing. Birmingham: Packt Publishing, 2021.
SILVA, Tulio Ferreira Leite da. Inteligência semiótica e TripAdvisor: deep learning e quantificações subjetivas na análise dos discursos de sanção de restaurante. 2021a. 126 p. Dissertação (Mestrado em Semiótica e Linguística Geral), Faculdade de Filosofia, Letras e Ciências Humanas, Universidade de São Paulo, São Paulo, 2021a. Disponível em: https://doi.org/10.11606/D.8.2021.tde-18052021-175948. Acesso em: 31 maio 2022.
SILVA, Tulio Ferreira Leite da. Remy.ai: Protótipo de sistema para mineração de avaliações de restaurantes. 2021b. 87 p. Monografia (Especialização em Big Data - Inteligência na Gestão dos Dados) - PECE - Programa de Educação Continuada em Engenharia, Escola Politécnica da Universidade de São Paulo, São Paulo, 2021b.
SILVA, Tulio Ferreira Leite da. The optimizing function of discursive semiotics in natural language processing. In: LEONE, Massimo et al. Semiotics of Artificial Intelligence. Saggi di Lexia. Aracne: Itália [no prelo].
SOUZA, Fábio. BERTimbau: Pretrained BERT models for Brazilian Portuguese. 2020. 62 p. Dissertação (Mestrado em Engenharia da Computação) - Faculdade de Engenharia Elétrica e de Computação, Unicamp, 2020.
SOUZA, Fábio; NOGUEIRA, Rodrigo; LOTUFO, Roberto. BERTimbau: Pretrained BERT Models for Brazilian Portuguese. In: CERRI, Ricardo; PRATI, Ronaldo (eds). Intelligent Systems. Cham: Springer, v.1, 2020. cap. 28, p. 403-417.
ULDALL, Hans Jørgen. Outline of Glossematics - Part 1: General Theory. Travaux du Cercle Linguistique de Copenhague. Copenhague: Nordisk Sprog-og Kulturforlag, v. 10, 1967.
VASWANI, Ashish; SHAZEER, Noam; PARMAR, Niki; USZKOREIT, Jakob; JONES, Llion; GOMEZ, Aidan N.; KAISER, Lukasz; POLOSUKHIN, Illia. Attention Is All You Need. Advances in Neural Information Processing Systems, Long Beach, n. 30, jun. 2018.
Downloads
Published
Issue
Section
License
Copyright (c) 2022 Tulio Ferreira Leite da Silva
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
The authors grant the journal all copyrights relating to the work published. The concepts expressed in signed articles are absolute and exclusive responsibility of their authors.
Funding data
-
Fundação de Amparo à Pesquisa do Estado de São Paulo
Grant numbers Processo: 20/15160-7