The video owner has disabled playback on external websites.

This video is no longer available on YouTube.

This video cannot be played right now.

Watch on YouTube

AI 학습 도구 잠금 해제

가입하여 모든 동영상에서 더 빠르게 학습할 수 있는 강력한 도구를 이용하세요.

장면 설명 표현 찾기 플래시카드 복습 섀도잉 연습 되말하기
무료 회원가입
B1 중급 프랑스어 26:16 Educational

Comment les I.A. font-elles pour comprendre notre langue ?

ScienceEtonnante · 596,687 조회수 · 추가됨 3일 전

학습 통계

B1

CEFR 레벨

5/10

난이도

자막 (493 세그먼트)

00:00

Que ce soit les chatbox, les logiciels de traduction automatique

00:03

ou encore les enceintes connectées,

00:05

de plus en plus d'applications semblent être capables de comprendre notre langue.

00:10

Jusqu'à une période récente, quand on voulait s'adresser à un ordinateur,

00:12

le seul moyen était d'utiliser un "langage de programmation",

00:16

un truc artificiel, très formalisé, avec des règles précises.

00:20

Mais de plus en plus il semblerait que grâce aux méthodes d'intelligence artificielle,

00:24

les machines soient capables de comprendre ce qu'on appelle le "langage naturel".

00:28

C'est-à-dire les langues que les humains utilisent au quotidien,

00:31

comme le français ou l'anglais.

00:33

Est-ce qu'on peut dire que les IA comprennent vraiment ce qu'on leur raconte,

00:36

qu'elles sont capables de penser avec les mêmes mots que nous ?

00:40

Eh bien, pour s'en faire une idée on va se pencher sur les méthodes utilisées

00:43

par ces algorithmes pour manipuler le langage naturel.

00:47

[Jingle]

00:53

Dans cette vidéo on va essentiellement parler des techniques d'IA

00:56

qu'on regroupe sous le terme de "machine learning",

00:58

l'apprentissage automatique,

01:00

et plus spécifiquement des fameuses techniques de "deep learning",

01:03

l'apprentissage profond.

01:05

Pour ceux que ça intéresse, j'avais déjà fait un épisode sur le sujet,

01:08

mais je vais quand même rappeler les principes de base.

01:11

L'idée est de considérer un algorithme qui est en gros une fonction,

01:14

c'est-à-dire comme une machine mathématique à qui on donne une entrée X

01:19

et qui va produire une certaine sortie Y.

01:22

Et on va apprendre à cet algorithme à faire quelque chose qui nous intéresse.

01:26

Prenons un cas concret classique : imaginons qu'on veuille

01:28

qu'un algorithme soit capable de reconnaitre ce qu'il y a sur des images.

01:32

En entrée X on veut pouvoir lui donner des images

01:34

et en sortie Y on attend pour chaque image, un mot qui la décrit.

01:38

Par exemple ici, on veut que l'algorithme nous réponde : "Chat".

01:41

Pour en arriver là, ça se passe en deux temps,

01:44

au départ l'algorithme n'est pas entrainé, il répond donc n'importe quoi,

01:48

donc dans la première phase, la phase d'apprentissage,

01:51

on va lui montrer des exemples de ce qu'on voudrait qu'il fasse,

01:54

par exemple en lui filant une base de données

01:56

de milliers d'images auxquelles on a déjà associé les bons mots.

02:00

Et, en voyant ces exemples, l'algorithme va se modifier progressivement

02:04

pour s'adapter à ce qu'on lui demande de faire.

02:07

Dit comme ça, ça a l'air magique, un algorithme qui se modifie,

02:10

mais mathématiquement ça se formalise bien.

02:13

La fonction mathématique qui relie Y et X dans l'algorithme

02:17

dispose d'une très grande quantité de paramètres,

02:20

on les appelle des poids et on note ça généralement "W".

02:23

Et voyez ces paramètres comme des boutons que l'algorithme peut tourner

02:26

pour faire varier la façon dont Y est construit à partir de X.

02:31

Durant la phase d'apprentissage, ces poids sont ajustés

02:33

de manière à coller aux exemples de la base de données,

02:36

ça peut prendre un certain temps en fonction de la taille de la base,

02:39

du nombre de poids et de la complexité du problème.

02:42

Et une fois cette phase terminée, l'algorithme est prêt,

02:45

il est entraîné et on peut s'en servir, c'est la phase d'utilisation.

02:49

On lui présente de nouvelles images, qu'il n'a jamais vues et,

02:52

si tout fonctionne bien, il sera capable de reconnaître ce qu'il y a dessus.

02:56

Voilà pour les grands principe du machine learning.

02:59

Là, je vous ai présenté le truc d'une façon assez abstraite,

03:01

je ne vous ai pas vraiment expliqué ce qu'on va utiliser

03:03

comme fonction pour réaliser tout ce travail.

03:06

Ces derniers temps on utilise majoritairement les réseaux de neurones

03:10

et notamment les réseaux dits "profonds"

03:12

qui ont l'avantage d'être à la fois très puissants et très flexibles,

03:16

mais la structure, l'architecture précise de ces réseaux

03:19

doit souvent être adaptée au problème qu'on considère.

03:22

Dans le cas de la reconnaissance d'image on utilise

03:24

ce qu'on appelle des réseaux de convolution

03:26

qui ont une capacité à reconnaître des choses intéressantes

03:29

dans une image en l'analysant successivement

03:32

à différentes échelles, d'une façon hiérarchique.

03:35

Par exemple sur cette image, un réseau de convolution va détecter d'abord

03:38

les variations de luminosité d'un pixel à l'autre,

03:41

qui représentent une frontière ou un trait

03:43

puis ces informations seront assemblées pour reconnaître

03:46

des bouts de segments ou des morceaux de courbes,

03:48

puis au niveau au dessus en combinant les segments et les courbes,

03:52

il peut reconnaître des formes géométriques.

03:55

Et c'est en combinant à nouveau ces caractéristiques globales

03:58

que le réseau peut finalement apprendre à reconnaître des images complètes.

04:02

Alors évidemment je vous le décris de façon assez sommaire,

04:05

mais on peut imaginer que cette façon hiérarchique d'analyser

04:08

aux différentes échelles ressemble à la façon dont notre vision à nous fonctionne.

04:13

Il y a quand même un point important que j'ai passé sous silence :

04:16

ces algorithmes de réseaux de neurones, je vous l'ai dit, n'ont rien de magique,

04:19

ce sont des fonctions mathématiques,

04:21

on les construit à partir d'opérations simples comme l'addition,

04:24

la multiplication la fonction exponentielle, etc.

04:26

Ça signifie que la seule chose que ces réseaux peuvent manipuler

04:30

eh bien ce sont des nombres.

04:32

Alors là je vous ai dit que pour faire de la reconnaissance d'image

04:35

on prenait des images en entrée et on avait des mots en sortie, alors, comment on fait ?

04:39

Pour les images c'est assez simple, on prend les pixels,

04:43

on regarde leur luminosité ou bien leurs couleurs

04:46

en rouge/vert/bleu et ça nous donne des nombres.

04:48

Pour une image de 400 par 400 pixels en couleur,

04:51

ça fait pas loin de 500 000 nombres en entrée,

04:54

c'est beaucoup, mais au moins ce sont des nombres que le réseau peut manipuler.

04:58

Et pour la sortie ?

04:59

Eh bien notre réseau ne parle ni anglais ni français,

05:02

il ne sait pas écrire des mots comme "chat" ou "voiture".

05:05

Donc il faut lui cadrer les choses,

전체 자막은 비디오 플레이어에서 이용 가능

연습 문제로 학습하기

이 동영상에서 어휘, 문법, 이해력 연습 문제를 만드세요

어휘 및 문법 이해력 퀴즈 IELTS 시험 쓰기 연습
회원가입해서 연습하기
아직 댓글이 없습니다. 첫 번째로 생각을 공유하세요!

가입하고 모든 기능 잠금 해제

진행 상황 추적, 단어 저장, 연습 문제 풀기

무료로 언어 학습