Colab a appris à écrire du code et d’autres nouvelles du monde de l’IA

Colab a appris à écrire du code et d’autres nouvelles du monde de l’IA

AI_Digest_1

Nous nous efforçons d’informer les lecteurs non seulement sur les événements de l’industrie du bitcoin, mais aussi de parler de ce qui se passe dans les domaines technologiques connexes – la cybersécurité et dans le monde de l’intelligence artificielle (IA).

ForkLog AI a recueilli les nouvelles les plus importantes du monde de l’IA au cours de la semaine dernière.

  • TikTok a déposé une plainte contre le bloc dans le Montana.
  • Meta a appris à l’IA à comprendre 4 000 langues vivantes.
  • Tencent a lancé une technologie de reconnaissance des paumes pour payer les trajets dans le métro de Pékin.
  • Un générateur d’images a été ajouté à Photoshop.
  • L’IA a appris à transformer les pensées des gens en vidéos.
  • L’écrivain a créé 97 livres en utilisant ChatGPT et Midjourney.
  • Les offres d’IA les plus importantes de la semaine dernière.

TikTok poursuit le blocage dans le Montana

Des représentants du service TikTok ont ​​poursuivi le Montana (États-Unis) en raison du blocage de l’application dans l’État. L’intimé est le procureur général Austin Knudsen.

Selon le procès, l’interdiction viole le droit des citoyens à la liberté d’expression, inscrit dans le premier amendement de la Constitution américaine, et un certain nombre d’autres lois.

Google Colab aura un générateur de code

Dans les mois à venir, Google ajoutera des fonctionnalités d’IA à Colab pour la programmation automatisée.

L’environnement cloud utilisera la famille de modèles Codey basée sur PaLM 2. Les algorithmes ont été formés sur un grand nombre d’extraits de code sous licence permissive provenant de sources externes et réglés pour le langage Python.

Parmi les nouveautés :

  • génération de chaînes à l’aide d’indices de langage naturel ;
  • saisie semi-automatique du code ;
  • chatbot pour répondre aux questions de programmation.

Dans un premier temps, la mise à jour sera disponible pour les propriétaires d’un abonnement Colab payant aux États-Unis. Plus tard, Google rendra les fonctionnalités de codage de l’IA gratuites pour le grand public.

Meta a introduit la famille de modèles de langage IA Massively Multilingual Speech (MMS). Le code source du projet est disponible sur GitHub.

Le MMS peut identifier plus de 4000 langues parlées, soit 40 fois plus que les capacités des analogues existants. Les algorithmes ont également appris à synthétiser la parole et à la convertir en texte dans environ 1100 dialectes.

Langues disponibles dans les modèles Meta MMS
Langues disponibles dans les modèles MMS. Données : Méta.

Pour former les modèles, les développeurs ont utilisé le Nouveau Testament, sur la base duquel ils ont créé deux ensembles de données. Le premier contient de l’audio et du texte en 1107 langues. Le second comprend des enregistrements vocaux non marqués dans 3809 dialectes.

La société a averti que parfois le MMS peut déchiffrer de manière incorrecte certains mots et phrases. Il y a aussi beaucoup de préjugés et de distorsions dans la Bible, a ajouté Meta.

Tencent lance un système de paiement par reconnaissance de paume

Tencent a lancé une technologie de reconnaissance des paumes pour payer les trajets dans le métro de Pékin via le service WeChat Pay.

Le système a été créé par le laboratoire d’IA de YouTu. Il identifie non seulement les paumes, mais également les veines, et prend également en compte les actions lorsque le bras est étendu pendant le scan et d’autres caractéristiques. Selon les développeurs, la technologie fonctionne dans diverses conditions d’éclairage.

L’utilisateur doit lier le compte WeChat au dispositif de reconnaissance et prendre une empreinte digitale dans une machine spéciale à la station de métro. Ensuite, il peut payer le voyage en passant sa main sur le scanner dans le tourniquet.

L’entreprise a testé le système à Shenzhen. À l’avenir, elle prévoit d’utiliser la technologie dans les bureaux, les campus, les centres commerciaux, les restaurants et d’autres lieux.

Bard a appris à chercher des images

Chatbot Bard a appris à afficher des images du moteur de recherche Google.

Par exemple, lorsqu’un utilisateur pose une question sur les sites touristiques de la Nouvelle-Orléans (Louisiane, États-Unis), le chatbot renverra une liste de lieux et leurs photos. Chaque image contient un lien vers la source.

Recherche d'images Google Bard
Recherche d’images dans Bard. Données : Google.

De plus, l’utilisateur peut demander des images directement à l’IA.

Générateur d’images ajouté à Photoshop

Adobe a ajouté l’outil Remplissage génératif à Photoshop.

La technologie est basée sur les modèles Firefly. Il vous permet de mettre à l’échelle des images à l’aide de requêtes textuelles en anglais, ainsi que d’ajouter et de supprimer des objets. L’outil prend en compte la perspective, l’éclairage et le style.

Un exemple d'utilisation du remplissage génératif dans Adobe Photoshop
Un exemple d’utilisation du remplissage génératif. Données : Adobe.

La société a également ajouté une nouvelle barre des tâches à l’éditeur avec un bouton Remplissage génératif qui apparaît lorsque des objets sont sélectionnés. Il vous permet de changer rapidement les images même sans invites.

Le remplissage génératif est disponible dans la version bêta de Photoshop pour PC. Une version complète de la technologie aura lieu au second semestre 2023.

YouTube utilise l’IA pour décrire les vidéos Shorts

YouTube a implémenté le modèle de langage visuel Flamingo pour créer des descriptions vidéo dans la section Shorts.

L’algorithme développé par DeepMind analyse les images initiales de la vidéo et tente de comprendre son contenu. Les descriptions générées par le modèle sont stockées sous forme de métadonnées pour « mieux catégoriser les vidéos et faire correspondre les résultats de recherche avec les requêtes des spectateurs ».

Selon Todd Sherman, directeur de la gestion des produits pour YouTube Shorts, le texte IA répond aux normes de responsabilité de la plateforme. Les situations dans lesquelles la technologie pourrait rendre la vidéo « sous un mauvais jour » sont peu probables, a-t-il ajouté.

Un porte-parole de DeepMind a déclaré que Flamingo avait déjà créé des descriptions pour de nombreuses vidéos, y compris les plus vues.

Des scientifiques ont créé un algorithme pour manipuler des images

Des experts du Max Planck Institute for Informatics, du MIT et de Google ont créé l’algorithme DragGAN AI pour manipuler des images.

La technologie est similaire à l’outil Warp de Photoshop. Au lieu de simplement déplacer des pixels, il utilise l’intelligence artificielle pour recréer l’objet sous-jacent, selon l’étude.

Avec DragGAN, vous pouvez modifier la taille des objets et leur apparence en quelques clics de souris. L’algorithme vous permet également de faire pivoter des objets en tant que modèles 3D.

Selon les chercheurs, l’approche est capable non seulement de créer une occlusion d’objets, mais aussi de les déformer en fonction de la rigidité, par exemple lors de la flexion de la jambe d’un cheval.

Google étend son outil de prévision des inondations à 80 pays

Google a étendu la disponibilité de son système de prévision des inondations Flood Hub AI.

La plate-forme peut être utilisée par les gouvernements, les organisations humanitaires et les résidents de 80 pays d’Asie-Pacifique, d’Afrique, d’Europe, d’Amérique du Sud et d’Amérique centrale. Il couvre désormais des zones où un pourcentage élevé de la population est menacé par des catastrophes naturelles, comme les Pays-Bas, le Vietnam, le Laos, le Cambodge et le Myanmar.

Flood Hub utilise deux modèles pour prédire les inondations causées par le débordement des rivières et des ruisseaux jusqu’à sept jours à l’avance. Le système détermine la quantité d’eau entrant dans le cours d’eau, la hauteur d’inondation prévue et les zones qui seront touchées par la catastrophe.

L’IA a appris à transformer les pensées des gens en vidéos

Des chercheurs singapouriens et chinois ont développé l’algorithme MinD-Video AI pour la reconstruction vidéo basée sur les données d’activité cérébrale.

Le système est un « pipeline à deux modules » d’un encodeur IRMf formé et d’une version déboguée du générateur d’images à diffusion stable. Pour sa formation, les experts ont utilisé un ensemble de données accessible au public contenant des vidéos et des enregistrements de l’activité cérébrale des sujets qui les regardaient.

premier_fig.6dc103c0a265e5faf4e9
Exemple MinD-Vidéo. Données : Étude sur la vision par ordinateur et la reconnaissance de formes.

Selon les chercheurs, l’algorithme reconstruit les vidéos avec une précision de 85 %. Les vidéos ont été jugées « de qualité raisonnablement élevée », comme en témoignent le mouvement et la dynamique des scènes, ont-ils ajouté.

L’écrivain a créé 97 livres avec l’aide de l’IA

Le fantastique Tim Boucher a utilisé l’IA pour écrire la série de livres AI Lore.

L’auteur a utilisé les chatbots ChatGPT et Anthropic Claude, ainsi que le générateur d’images Midjourney. Chaque ouvrage contient de 2000 à 5000 mots et comprend de 40 à 140 illustrations.

En neuf mois, Boucher a créé 97 livres. Selon lui, il a gagné près de 2 000 $ en vendant 574 exemplaires.

Les offres d’IA les plus importantes de la semaine dernière

Du 21 au 27 mai, les startups de l’IA ont levé plus de 969 millions de dollars. Voici les offres les plus intéressantes.

  • Anthropic a levé 450 millions de dollars pour créer « des systèmes d’IA utiles, inoffensifs et honnêtes ».
  • L’équipe Tools for Humanity AI, qui comprend les développeurs de la startup crypto Worldcoin de Sam Altman, a levé 115 millions de dollars.
  • Une société de capital-risque qui utilise l’intelligence artificielle pour trouver des startups prometteuses, Moonfire a reçu 115 millions de dollars.
  • La plateforme de marketing IA Insider lève 105 millions de dollars
  • Figure a levé 70 millions de dollars pour construire un robot humanoïde.
  • FlowX AI a reçu 35 millions de dollars pour développer une technologie qui permet aux entreprises de déplacer des logiciels anciens et nouveaux en un seul endroit pour développer et exécuter des applications et des services basés sur ceux-ci.
  • Elementl a levé 33 millions de dollars pour prendre en charge une plate-forme d’orchestration de données alimentée par Dagster.
  • Les créateurs du robot manipulateur et du véhicule tout-terrain à utiliser dans l’espace Gitai ont reçu 30 millions de dollars.
  • Datasembly a levé 16 millions de dollars pour développer une plateforme d’analyse de données volumineuses pour les détaillants et les fabricants de biens de consommation.

Aussi sur ForkLog :

Quoi lire le week-end ?

ForkLog a examiné les concepts de base de l’IA éthique et a essayé de déterminer si cela est vraiment important pour le développement d’une intelligence artificielle sûre.

Abonnez-vous à ForkLog sur les réseaux sociaux

Vous avez trouvé une erreur dans le texte ? Sélectionnez-le et appuyez sur CTRL + ENTRÉE

Newsletters ForkLog : Gardez le doigt sur le pouls de l’industrie du bitcoin !



Voir l’article original sur forklog.com