Willkommen in der OVHcloud Community

Stellen Sie Fragen, suchen Sie nach Informationen, veröffentlichen Sie Inhalte und interagieren Sie mit anderen Mitgliedern der OVHcloud Community.

... / AI Endpoints - audio anal...

< Previous question - Next question >

Frage

AI Endpoints - audio analysis - diarization

E

Von

EmmanuelM55

Erstellungsdatum 2024-07-08 07:17:23 (edited on 2024-09-04 12:55:01) in AI and Machine Learning OVHcloud

Bonjour!

Je suis en train de tester les endpoints IA proposé sur la page : https://endpoints.ai.cloud.ovh.net/
et plus précisément les modèles de 'speechtotext'. Les modèles ASR proposés par Nvidia peuvent à travers une configuration spécifique gérer la 'diarization' qui permet en plus de la simple transcription de reconnaitre les voix des interlocuteurs dans le dialogue audio.

J'ai pu utiliser le modèle ASR pour transcrire des fichiers audio mais n'arrive pas à utiliser la 'diarization'. J'ai l'impression que cette fonctionnalité n'est pas accessible sur les modèles déployés sur l'api OVH.
Si vous avez plus de détail sur ce sujet, je suis intéressé!!

Bon code à vous!

Positive Bewertungen (0)

1080 Ansichten

6 Antworten ( Latest reply on 2024-08-02 09:40:52 Von

OVHcloud-AI-Team

)

O

OVHcloud-AI-Team

Bonjour Emmanuel !

Merci pour votre retour. En effet, la **diarization** était jusqu'à présent indisponible sur nos AI Endpoints d'ASR. Elle sera disponible pour les différentes langues d'ici quelques jours avec un tutoriel associé.
Je reviendrai vers vous quand cette nouvelle feature sera disponible.

Bien à vous.

Eléa Petton,
AI Solutions Team

Hilfreich (0)

E

EmmanuelM55

Autor

Quid de la détection de la langue? Est ce que cela sera aussi possible?

Hâte de tester cela.

En attendant, voilà ce que j'ai réalisé avec les endpoints :
https://huggingface.co/spaces/QnoM/OVHcloud_AI_endpoints

Bonne journée!

Hilfreich (0)

O

OVHcloud-AI-Team

Bonjour,
Oui, je fais partie de l'équipe AI Solutions (équipe de la PU.AI). Nous venons de prendre connaissance des messages sur les produits IA d'OVH sur ce forum. Par conséquent nous souhaitons pouvoir répondre aux questions concernant les produits, notamment AI Endpoints.

Hilfreich (0)

O

OVHcloud-AI-Team

Pour la détection de la langue, cela n'est pas encore possible, mais on prend note de votre besoin.

Un grand merci pour le partage de votre travail ! Je vais le partager avec le reste de l'équipe AI.
Si jamais vous souhaitez en faire profiter les autres utilisateurs d'AI Endpoints, vous pouvez nous rejoindre et le partager sur Discord : https://discord.com/channels/850031577277792286/1217892323640344626

Bonne fin de journée !

Eléa Petton,
AI Solutions Team

Hilfreich (0)

O

OVHcloud-AI-Team

Bonjour @EmmanuelM55 !

Pour information nous avons ajouté les modèles d'ASR permettant de faire de la diarization sur AI Endpoints. Ils sont directement intégrés dans les endpoints existants.

Pour plus d'informations sur l'utilisation, je vous transmets le tutoriel associé : https://github.com/ovh/public-cloud-examples/blob/ep-tuto-notebooks-asr-tts/ai/ai-endpoints/asr-features/tutorial-asr-diarization.ipynb

Eléa Petton,
AI Solutions Team

Hilfreich (0)

Willkommen in der OVHcloud Community

Stellen Sie Fragen, suchen Sie nach Informationen, veröffentlichen Sie Inhalte und interagieren Sie mit anderen Mitgliedern der OVHcloud Community.

AI Endpoints - audio analysis - diarization

Related questions

An Diskussion teilnehmen

Empfohlene Inhalte

Most recent in same Forum