Bonjour!
Je suis en train de tester les endpoints IA proposé sur la page : https://endpoints.ai.cloud.ovh.net/
et plus précisément les modèles de 'speechtotext'. Les modèles ASR proposés par Nvidia peuvent à travers une configuration spécifique gérer la 'diarization' qui permet en plus de la simple transcription de reconnaitre les voix des interlocuteurs dans le dialogue audio.
J'ai pu utiliser le modèle ASR pour transcrire des fichiers audio mais n'arrive pas à utiliser la 'diarization'. J'ai l'impression que cette fonctionnalité n'est pas accessible sur les modèles déployés sur l'api OVH.
Si vous avez plus de détail sur ce sujet, je suis intéressé!!
Bon code à vous!
AI and Machine Learning OVHcloud - AI Endpoints - audio analysis - diarization
Related questions
- Mon site perdu sur Google
3923
11.09.2021 07:13
- OVH Prescience 1.4.0
3787
24.10.2018 14:14
- Erreur optimisation
3736
02.04.2019 14:03
- Aide configuré ftp filezilla
2994
22.12.2020 15:48
- Message d erreur à l étape 10 sur 11: Step fail
2930
29.10.2020 13:54
- Library problem
2739
11.02.2021 14:00
- Pb avec l'exemple "premiers pas"
2714
18.03.2020 17:32
- Possible de remplacer Betty?
2700
21.12.2020 09:11
- Modifier l'adresse inscrite sur mon site web
2680
14.09.2021 15:56
- Impossible de modifier ma base de données
2594
25.02.2021 14:57
Bonjour Emmanuel !
Merci pour votre retour. En effet, la **diarization** était jusqu'à présent indisponible sur nos AI Endpoints d'ASR. Elle sera disponible pour les différentes langues d'ici quelques jours avec un tutoriel associé.
Je reviendrai vers vous quand cette nouvelle feature sera disponible.
Bien à vous.
Eléa Petton,
AI Solutions Team
Bonjour @OVHcloud-AI-Team
Faites-vous partie de la Team OVH ?
Quid de la détection de la langue? Est ce que cela sera aussi possible?
Hâte de tester cela.
En attendant, voilà ce que j'ai réalisé avec les endpoints :
https://huggingface.co/spaces/QnoM/OVHcloud_AI_endpoints
Bonne journée!
Bonjour,
Oui, je fais partie de l'équipe AI Solutions (équipe de la PU.AI). Nous venons de prendre connaissance des messages sur les produits IA d'OVH sur ce forum. Par conséquent nous souhaitons pouvoir répondre aux questions concernant les produits, notamment AI Endpoints.
Pour la détection de la langue, cela n'est pas encore possible, mais on prend note de votre besoin.
Un grand merci pour le partage de votre travail ! Je vais le partager avec le reste de l'équipe AI.
Si jamais vous souhaitez en faire profiter les autres utilisateurs d'AI Endpoints, vous pouvez nous rejoindre et le partager sur Discord : https://discord.com/channels/850031577277792286/1217892323640344626
Bonne fin de journée !
Eléa Petton,
AI Solutions Team
Bonjour @EmmanuelM55 !
Pour information nous avons ajouté les modèles d'ASR permettant de faire de la diarization sur AI Endpoints. Ils sont directement intégrés dans les endpoints existants.
Pour plus d'informations sur l'utilisation, je vous transmets le tutoriel associé : https://github.com/ovh/public-cloud-examples/blob/ep-tuto-notebooks-asr-tts/ai/ai-endpoints/asr-features/tutorial-asr-diarization.ipynb
Eléa Petton,
AI Solutions Team