Módulo Whisper

Resumo

Para permitir a indexação de vídeos, é essencial o uso de um módulo de inteligência artificial adicional. Nesse contexto, utilizamos o modelo do Whisper, que emprega arquiteturas transformers para reconhecer o conteúdo de áudios e convertê-los em texto, ao mesmo tempo em que segmenta os trechos relevantes dos áudios. Dessa forma, o modelo do Whisper desempenha um papel crucial na extração de informações dos vídeos, possibilitando a indexação adequada do seu conteúdo. Ao aplicar técnicas avançadas baseadas em inteligência artificial, é possível identificar os elementos de áudio e convertê-los em texto legível, permitindo uma análise mais detalhada e segmentação precisa dos trechos relevantes presentes nos vídeos.

Propriedade Intelectual: Software

Nº do Processo: BR 51 2024 000800 4

Titularidade: Instituto Federal de Educação, Ciência e Tecnologia do Ceará/A2CP EMPREENDIMENTOS LTDA/ IOSI TREINAMENTO CONSULTORIA E SERVICOS DE INFORMATICA LTDA/ SMARTNEXT

Status do Ativo: Registrado

Linguagem: Python3.10, Pip, SQS, Numpy, Matplotlib, Scikit-learn, Pytorch, Whisper

Campo de Aplicação: ED 06