AI and Machine Learning OVHcloud - AI Endpoints - audio analysis - diarization
... / AI Endpoints - audio anal...
BMPCreated with Sketch.BMPZIPCreated with Sketch.ZIPXLSCreated with Sketch.XLSTXTCreated with Sketch.TXTPPTCreated with Sketch.PPTPNGCreated with Sketch.PNGPDFCreated with Sketch.PDFJPGCreated with Sketch.JPGGIFCreated with Sketch.GIFDOCCreated with Sketch.DOC Error Created with Sketch.
Frage

AI Endpoints - audio analysis - diarization

Von
EmmanuelM55
Erstellungsdatum 2024-07-08 07:17:23 (edited on 2024-09-04 12:55:01) in AI and Machine Learning OVHcloud

Bonjour!

Je suis en train de tester les endpoints IA proposé sur la page : https://endpoints.ai.cloud.ovh.net/
et plus précisément les modèles de 'speechtotext'. Les modèles ASR proposés par Nvidia peuvent à travers une configuration spécifique gérer la 'diarization' qui permet en plus de la simple transcription de reconnaitre les voix des interlocuteurs dans le dialogue audio.

J'ai pu utiliser le modèle ASR pour transcrire des fichiers audio mais n'arrive pas à utiliser la 'diarization'. J'ai l'impression que cette fonctionnalité n'est pas accessible sur les modèles déployés sur l'api OVH.
Si vous avez plus de détail sur ce sujet, je suis intéressé!!

Bon code à vous!


6 Antworten ( Latest reply on 2024-08-02 09:40:52 Von
OVHcloud-AI-Team
)

Bonjour Emmanuel !

Merci pour votre retour. En effet, la **diarization** était jusqu'à présent indisponible sur nos AI Endpoints d'ASR. Elle sera disponible pour les différentes langues d'ici quelques jours avec un tutoriel associé.
Je reviendrai vers vous quand cette nouvelle feature sera disponible.

Bien à vous.

Eléa Petton,
AI Solutions Team


Eléa Petton,
AI Solutions Team

Bonjour @OVHcloud-AI-Team

Faites-vous partie de la Team OVH ?

Quid de la détection de la langue? Est ce que cela sera aussi possible?

Hâte de tester cela.

En attendant, voilà ce que j'ai réalisé avec les endpoints :
https://huggingface.co/spaces/QnoM/OVHcloud_AI_endpoints

Bonne journée!

Bonjour,
Oui, je fais partie de l'équipe AI Solutions (équipe de la PU.AI). Nous venons de prendre connaissance des messages sur les produits IA d'OVH sur ce forum. Par conséquent nous souhaitons pouvoir répondre aux questions concernant les produits, notamment AI Endpoints.

Pour la détection de la langue, cela n'est pas encore possible, mais on prend note de votre besoin.

Un grand merci pour le partage de votre travail ! Je vais le partager avec le reste de l'équipe AI.
Si jamais vous souhaitez en faire profiter les autres utilisateurs d'AI Endpoints, vous pouvez nous rejoindre et le partager sur Discord : https://discord.com/channels/850031577277792286/1217892323640344626

Bonne fin de journée !

Eléa Petton,
AI Solutions Team

Bonjour @EmmanuelM55 !

Pour information nous avons ajouté les modèles d'ASR permettant de faire de la diarization sur AI Endpoints. Ils sont directement intégrés dans les endpoints existants.

Pour plus d'informations sur l'utilisation, je vous transmets le tutoriel associé : https://github.com/ovh/public-cloud-examples/blob/ep-tuto-notebooks-asr-tts/ai/ai-endpoints/asr-features/tutorial-asr-diarization.ipynb

Eléa Petton,
AI Solutions Team

Antworten sind derzeit für diese Frage deaktiviert.