CLASSIFICAÇÃO DE DOCUMENTOS DE PATENTES USANDO O DOC2VEC



CLASSIFICAÇÃO DE DOCUMENTOS DE PATENTES USANDO O DOC2VEC
Tamara Aguiar Tavares Mascarenhas
Alberto Willian Mascarenhas
Andreia Gentil Bonfante

01/07/2021
173-184
11
As patentes são consideradas fontes extremamente úteis para atividades relacionadas à busca e análise de informações e para a geração de novos conhecimentos. Neste artigo, usamos um algoritmo de vetor de parágrafo doc2vec, uma extensão do word2vec, que aprende representações de frases em um documento, em um esquema de aprendizagem profunda supervisionada para a classificação automática de patentes. A classificação foi realizada em documentos com resumos de patentes em inglês, em um processo hierárquico que compreende seções, classes, subclasses, de acordo com a Classificação Internacional de Patentes (IPC). Os testes foram desenvolvidos em quatro etapas, necessária, devido ao grande número de classes e subclasses, com o objetivo de identificar códigos IPC primário ou secundários, caso esteja associado a um conjunto de classificações relacionadas a outros aspectos expressos na patente. Os testes apresentaram resultados bastante promissores na classificação de patentes. Os próximos passos serão produzir avaliações qualitativas e compará-las com outros modelos de aprendizagem de máquina presentes na literatura.
Ler mais...Patentes, Similaridade, Doc2vec, Aprendizagem profunda.
ADMINISTRAÇÃO: PRINCÍPIOS DE ADMINISTRAÇÃO E SUAS TENDÊNCIAS - VOLUME 2
Esta obra está licenciada com uma Licença Creative Commons Atribuição-NãoComercial-SemDerivações 4.0 Internacional .
O conteúdo dos capítulos e seus dados e sua forma, correção e confiabilidade, são de responsabilidade exclusiva do(s) autor(es). É permitido o download e compartilhamento desde que pela origem e no formato Acesso Livre (Open Access), com os créditos e citação atribuídos ao(s) respectivo(s) autor(es). Não é permitido: alteração de nenhuma forma, catalogação em plataformas de acesso restrito e utilização para fins comerciais. O(s) autor(es) mantêm os direitos autorais do texto.