Qual é a diferença entre aprendizado de máquina supervisionado, não supervisionado e auto-supervisionado?

O aprendizado supervisionado usa dados com rótulos para resolver um problema (por exemplo, se os dados são gravações de áudio da fala e os rótulos são o texto do que foi dito, a fala para texto pode ser formulada como uma tarefa de aprendizagem supervisionada para combinar o áudio com o áudio. as palavras que foram ditas).

A aprendizagem não supervisionada, por outro lado, não tem rótulos. Ainda assim, pode-se usar algoritmos de agrupamento em pontos de dados para extrair padrões ou usar outras técnicas de análise (por exemplo, para um grande corpus de texto não rotulado, pode-se usar modelagem de linguagem para prever a próxima palavra em uma sequência de frases). Observe os auto-codificadores, que podem aprender a gerar espaços / representações latentes de baixa dimensão para dados de maneira não supervisionada.

O aprendizado semi-supervisionado está no meio. Há um pequeno conjunto de dados rotulados e um conjunto muito maior de dados não rotulados. Isso ocorre geralmente porque os dados são difíceis e caros de rotular, portanto, as empresas / entidades estão dispostas a rotular apenas parte de um conjunto de dados. Pode-se usar os dados rotulados para prever rótulos para todo o conjunto de dados ou, de outra forma, alavancar os dados não rotulados de maneira não supervisionada.

No entanto, há uma área cinza entre essas três técnicas. Considere a tarefa de previsão da próxima palavra, em que você recebe uma sequência de palavras e pede para prever as próximas palavras. Isso não é supervisionado? Mais ou menos, porque o texto não contém outros rótulos. No entanto, também pode ser visto como supervisionado, onde cada palavra seguinte é o rótulo ou a saída desejada, quando a entrada é a sequência de palavras antes dela. Dessa maneira, diferentes problemas e técnicas podem ser um tanto ambíguos quanto ao fato de serem supervisionados / não supervisionados / semissupervisionados.