Google reconnaissance vocale et réseau de neurones

Google déploie une technologie de reconnaissance vocale de bout en bout entièrement pilotée par des réseaux de neurones pour la saisie vocale dans son application clavier virtuel Gboard.

Dans un article, Google présente un nouveau modèle formé avec un transducteur de réseau neuronal récurrent (RNN-T) suffisamment compact pour fonctionner sur un smartphone. Selon la fonction de reconnaissance vocale de bout en bout en continu pour les appareils mobiles, les modèles de bout en bout prédisent directement la sortie de caractères en fonction de l’entrée vocale, et sont de bons candidats pour l’exécution de la reconnaissance vocale sur les périphériques. L’équipe de recherche de Google a découvert dans ses expériences que l’approche par RNN-T surpassait un modèle conventionnel basé sur la classification temporelle connectionniste (CTC) en termes de latence et de précision.

Les systèmes traditionnels de reconnaissance vocale identifient les phonèmes (unités sonores) à partir de segments audio, un modèle pour relier les phonèmes en mots, et un modèle de langage pour analyser la probabilité d’une phrase donnée, selon l’article. Les chercheurs ont commencé à essayer de passer directement de la forme d’onde d’entrée à la phrase de sortie en formant un seul réseau de neurones vers 2014, ce qui a conduit à l’élaboration de modèles ” basés sur l’attention ” et ” l’écoute”. Bien que ces systèmes aient une précision prometteuse, ils nécessitent généralement l’analyse complète de l’ensemble de la séquence d’entrée, de sorte qu’ils ne peuvent pas prendre en charge la transcription en temps réel. Des techniques de CTC ont également été développées, réduisant la latence des systèmes de reconnaissance vocale.

“Cela s’est avéré être une étape importante dans la création de l’architecture de RNN-T adoptée dans cette dernière version, ce qui peut être considéré comme une généralisation de la CTC”, écrit Johan Schalkwyk, un Google Fellow de l’équipe Speech de la société.

Les modèles RNN-T émettent des caractères un par un, en utilisant une boucle de rétroaction qui renvoie les symboles prédits (généralement des lettres) dans le modèle pour prédire le suivant. Les premières versions réduisaient le taux d’erreurs des mots, mais la formation était intensive en calcul.
Les chercheurs ont mis au point une implémentation parallèle permettant de gérer efficacement de grande quantité sur le matériel cloud haute performance de l’unité de traitement du tenseur (Tensor Processing Unit : TPU v2) de Google, ce qui a accéléré la formation.

Les graphiques de recherche utilisés par les moteurs de reconnaissance vocale traditionnels sont encore trop volumineux pour fonctionner sur des appareils mobiles. Cependant, les modèles de production de Google atteignaient presque 2 Go malgré des techniques de décodage sophistiquées. Les chercheurs ont mis au point une méthode de décodage avec recherche de faisceau sur un réseau de neurones unique pour obtenir la même précision avec un modèle de 450 Mo. Puis ils ont réduit la taille avec la quantification des paramètres et les techniques de noyau hybride, pour finalement réduire le modèle final à 80 Mo.

Le nouveau système de reconnaissance vocale Gboard sera initialement lancé sur les téléphones Pixel en anglais américain, mais les chercheurs sont optimistes quant à la possibilité d’ajouter plus de langues et de domaines d’application grâce à des améliorations matérielles et algorithmiques spécialisées.

Les marchés de la reconnaissance vocale et de la parole devraient atteindre 6,9 milliards de dollars d’ici 2025.

Google AI blog

La Chine pourrait devenir le leader mondial des recherches sur l’IA

La Chine dépassera l’Europe en termes de production de documents de recherche sur l’intelligence artificielle dans les quatre prochaines années si les tendances actuelles se maintiennent, selon un rapport publié par Elsevier.

Le rapport révèle que les États-Unis, qui abritent des géants de la technologie tels que Google, Amazon et Facebook, ont réussi à attirer les meilleurs talents en intelligence artificielle. Il montre également que la recherche aux États-Unis est en train de passer des milieux universitaires aux opérations de recherche au sein de grandes entreprises technologiques.

La Chine a commencé à dépasser les recherches américaines en nombre de documents publiés en 2004, a indiqué le rapport.

“La Chine aspire à devenir le leader mondial en matière d’intelligence artificielle et s’appuie sur des politiques nationales ambitieuses”, indique le rapport. « Les chercheurs chinois en intelligence artificielle pensent que l’environnement de recherche est attrayant. L’Intelligence artificielle chinoise se concentre sur la vision par ordinateur et ne dispose pas d’un traitement du langage naturel dédié et pôle de représentation des connaissances, y compris la reconnaissance vocale, peut-être parce que ce type de recherche en Chine est réalisée par des sociétés qui ne peuvent pas publier autant d’articles scientifiques.

Outre des recherches de plus en plus nombreuses menées par des entreprises telles que Baidu et Tencent, la Chine abrite certaines des sociétés d’IA les mieux financées sur la planète.

Plus tôt cette semaine, par exemple, il a été annoncé que la société mère de Face ++, Megvii, chercherait à lever 500 millions de dollars supplémentaires pour une valorisation de 3,5 milliards de dollars.

En plus des rapports du Future Today Institute et du rapport annuel sur les tendances Internet qui décrivent la domination croissante de l’intelligence artificielle en Chine, des sommités technologiques telles que le Dr Kai-Fu Lee et l’ancien chef des opérations de Baidu, Qi Lu – qui ont occupé des postes de direction dans les plus grandes entreprises de technologie aux États-Unis et en Chine – ont prédit que les initiatives d’intelligence artificielle chinoises dépasseraient celles d’autres régions du monde dans les années à venir.

La Chine, prochaine superpuissance de l’intelligence artificielle?

Malgré le nombre total d’articles publiés, les travaux de recherche sur l’IA en Chine n’ont pas vu autant de citations parmi leurs pairs, une tendance qui pourrait être un symptôme de portée régionale plutôt que mondiale, révèle le rapport.

Globalement, le nombre d’articles de recherche sur l’intelligence artificielle publiés a augmenté de 12,9% au cours des cinq dernières années, tandis que les pré-impressions d’Arxiv dans des domaines clés de l’intelligence artificielle, tels que le traitement du langage naturel et la vision par ordinateur, ont augmenté de 37% au cours des cinq dernières années.

L’Inde figure actuellement au troisième rang des publications de recherche sur l’IA, derrière les États-Unis et la Chine. L’Allemagne et le Japon se classent aux cinquième et sixième rangs mondiaux pour la production de documents de recherche sur l’IA, tandis que l’Iran, au neuvième rang, se classe aux côtés de pays comme la France et le Canada.

Les catégories de publications qui ont connu la plus forte croissance au cours de cette période comprennent le machine learning et le raisonnement probabiliste, la vision par ordinateur et les réseaux de neurones.

L’Europe occupe actuellement la première place mondiale en matière de publications scientifiques sur l’intelligence artificielle, selon le rapport.

Le rapport annuel sur l’état des technologies européennes, publié l’année dernière par la société de capital-risque Atomico, préconisait de resserrer les liens entre le secteur des technologies de la région et les instituts de recherche afin de concurrencer la Chine et les États-Unis.

Venturebeat

Intelligence artificielle : enjeux juridiques et fiscaux

L’association AM2FA du Master 2 Droit Fiscal – Fiscalité Appliquée vous invite à son prestigieux colloque annuel sur le thème “Intelligence artificielle : enjeux juridiques et fiscaux“.

Intelligence artificielle, robotique, réseaux de neurones et algorithmes sont autant de termes de plus en plus présents dans le discours médiatique et technologique. Vecteurs d’innovations et de transformations, ces nouvelles techniques vont, sans aucun doute, révolutionner les notions et méthodes, que ce soit dans un contexte sociétal, entrepreneurial ou philosophique.

En tant que nouveau phénomène, le droit a vocation à s’en saisir par réaction. S’il est désormais admis que le droit et l’intelligence artificielle ont vocation à entretenir des relations mutuelles d’influences réciproques, la donnée fiscale reste peu envisagée. Sujette à des divergences d’interprétations, la notion d’intelligence artificielle pose question. S’en suivent des hésitations sur la portée fiscale à donner à l’intelligence artificielle et ses déclinaisons : faut-il les considérer comme des extensions du numérique, phénomène commençant à être appréhendé au plan fiscal, ou faut-il les considérer comme un phénomène autonome et spécifique ?

La dimension théorique du sujet, ainsi que ses enjeux pratiques et techniques, conduisent nécessairement à retenir une approche plus large que les simples acceptions fiscales françaises. Le droit commun et le droit fiscal étant potentiellement soumis à un élément d’extranéité lorsque confrontés à une intelligence artificielle, il faut se livrer à une approche comparatiste et internationaliste de la problématique des aspects juridiques et fiscaux de l’intelligence artificielle. Ainsi, seront notamment étudiées les questions du droit à appliquer aux intelligences artificielles elles-mêmes, ou encore la question d’une imposition des revenus générés par une intelligence artificielle.

Ces points seront l’objet du colloque annuel du Master 2 Droit Fiscal de l’UPEC, faisant intervenir des universitaires, avocats, membres de juridictions, politiques, français et étrangers, afin d’éclairer ces nouvelles perspectives.

Colloque validé au titre de la formation professionnelle des avocats.

Pour des raisons de sécurité, une pièce d’identité pourra vous être demandée à l’entrée.

Inscriptions