O desafio da deduplicação de publicações: criação e avaliação de um benchmark
| Número de edição do periódico | 9 | pt_BR |
| Autor | Mena-Chalco, Jesús Pascual | |
| Autor | Dias, Thiago Magela Rodrigues | |
| Autor | Canto, Fabio Lorensi do | |
| Autor | Moreira, Tales Henrique José | |
| Autor | Carvalho Segundo, Washington Luís Ribeiro de | |
| Data de Acesso | 2024-08-19T17:42:07Z | |
| Data disponível | 2024-08-19T17:42:07Z | |
| Ano de publicação | 2024-07-23 | |
| Abstract | N/A | pt_BR |
| Resumo | O objetivo deste artigo é apresentar um conjunto de 10 regras usadas para a criação de um benchmark e sua avaliação usando casamentro aproximado baseado na similaridade de Levenshtein. A finalidade prática é de trazer insumos para investigar o desafio da deduplicação de publicações. Após avaliação, algumas regras apresentaram desafios, ressaltando a complexidade da deduplicação e a necessidade por estratégias mais sofisticadas à de casamento aproximado. A análise das publicações não deduplicadas revela uma queda acentuada com diferentes valores de similaridade, enfatizando a necessidade de ajustar parâmetros conforme o contexto. Este trabalho caminha na direção da definição de estratégias eficazes e abrangentes para a deduplicação de artigos científicos. | pt_BR |
| Citação | MENA-CHALCO, Jesus Pascual et al.O desafio da deduplicação de publicações: criação e avaliação de um benchmark. In: ENCONTRO BRASILEIRO DE BIBLIOMETRIA E CIENTOMETRIA – EBBC, 9., 2024, Brasília. Anais [...] Brasília, 2024. p. 1-8. DOI: https://doi.org/10.22477/ix.ebbc.411. Disponível em: https://ebbc.inf.br/ojs/index.php/ebbc/article/view/411. Acesso em: 9 ago. 2024. | pt_BR |
| DOI (Identificador de Objeto Digital) | https://doi.org/10.22477/ix.ebbc.411 | pt_BR |
| Identificador ISSN | 2675-5939 | pt_BR |
| URI | http://ridi.ibict.br/handle/123456789/1323 | |
| Idioma | por | pt_BR |
| Instituição | Universidade Federal do ABC; Centro Federal de Educação Tecnológica de Minas Gerais; Universidade Federal de Santa Catarina; Instituto Brasileiro de Informação em Ciência e Tecnologia | pt_BR |
| País | Brasil | pt_BR |
| Insituição | UFABC; CEFET-MG; UFSC; Ibict | pt_BR |
| Título do periódico | Encontro Brasileiro de Bibliometria e Cientometria – EBBC | pt_BR |
| Tipo de acesso | Acesso Aberto | pt_BR |
| Palavra Chave | Deduplicação | pt_BR |
| Palavra Chave | Publicações científicas | pt_BR |
| Palavra Chave | Benchmark | pt_BR |
| Palavra Chave | Regras | pt_BR |
| Área de conhecimento CNPq | CNPQ::CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO | pt_BR |
| Título | O desafio da deduplicação de publicações: criação e avaliação de um benchmark | pt_BR |
| Tipo | Trabalho apresentado em evento | pt_BR |
Arquivos
Pacote original
1 - 1 de 1
Carregando...
- Nome:
- O desafio da deduplicação de publicações.pdf
- Tamanho:
- 662.89 KB
- Formato:
- Adobe Portable Document Format
Licença do pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 1.82 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: