![](https://static.wixstatic.com/media/5032c8_7bc7cfbdef134417b652aefe00ba3b3c~mv2.png)
Gino News
terça-feira, 24 de setembro de 2024
Universal-1: O Novo Padrão em Reconhecimento de Fala com Ruby
A AssemblyAI anunciou o Universal-1, seu mais recente modelo de reconhecimento de fala, que promete precisão quase humana na transcrição de áudio, mesmo em condições desafiadoras como sotaques e ruídos de fundo. Com suporte para várias línguas e uma velocidade de processamento significativamente maior, o modelo é ideal para aplicações que exigem alta precisão.
![Create a detailed, two-dimensional, and linear 2D illustration that evokes a corporate and modern mood. Use a flat style that uses bright and vibrant colors in a white and untextured background. The image should depict a male South Asian developer working on a contemporary computer with Ruby code visible on the screen, situated in an office environment. Scattered around him and floating mid-air, create audio wave symbols and transcription icons, symbolizing audio being processed and the conversion of speech into text. This image artistically represents the cutting-edge technology of speech recognition including accents and background noises.](https://static.wixstatic.com/media/5032c8_d45eaa71c0c8422cb0e3d2fb76856dcd~mv2.png)
Imagem gerada utilizando Dall-E 3
O modelo Universal-1 foi treinado com milhões de horas de dados de áudio, alcançando uma precisão de *10% maior* em comparação com os principais modelos comerciais em inglês, espanhol e alemão. Além disso, a taxa de erros foi reduzida em *30%* em relação ao modelo Whisper, e a velocidade de processamento é *cinco vezes* superior ao Whisper Large-v3.
Superioridade em precisão de transcrição.
Redução significativa de erros.
Aumento considerável na velocidade de processamento.
Para facilitar a integração do modelo em aplicações Ruby, a AssemblyAI disponibilizou um SDK. O processo de instalação é simples e permite que os desenvolvedores transcrevam arquivos de áudio rapidamente, utilizando a configuração padrão para obter a melhor precisão.
- Transcrição de arquivos de áudio a partir de URLs. - Suporte para transcrição de arquivos locais. - Alternativa econômica com o modelo Nano.
Além do modelo Universal-1, a AssemblyAI introduziu novos recursos como detecção de entidades, moderação de conteúdo e redação de informações pessoais, ampliando as capacidades de suas soluções de inteligência de áudio.
O lançamento do Universal-1 representa um avanço significativo na tecnologia de reconhecimento de fala, oferecendo soluções mais rápidas e precisas para desenvolvedores. As inovações introduzidas podem impactar positivamente a forma como as empresas utilizam transcrição de áudio em suas operações.
FONTES:
REDATOR
![](https://static.wixstatic.com/media/5032c8_0f313ec0e5b54637a4735721d320cc4d~mv2.png)
Gino AI
1 de outubro de 2024 às 00:53:50