Inicio

Aprendizagem de Máquina

Tabela de conteúdo:

IA aprendendo

Introdução

Aprendizagem de máquina, também chamada de aprendizagem automática, de acordo com Arthur Samuel em 1959,

dota computadores com a habilidade de aprender sem terem sido especificamente programados. 1

Andrew NG parece preferir dizer:

sem terem sido aparentemente especificamente programados. [2] (https://pt.coursera.org/learn/machine-learning), 3

Vamos tentar desenvolver um pouco a idéia por trás da aprendizagem de máquina, que faz parte da área chamada de inteligncia artificial (AI, do ingls, IA).

O estado de um objeto em um dado momento é definido por seus dados. Existem vários tipos de dados, como, numéricos, palavras, outros objetos, símbolos. Nos interessam aquí os dados simbólicos. Na verdade, podemos definir codigos para traduzir simbolos em outros simbolos. Computadores utilizam apenas alfabeto binário.

Nós realizamos tranformações em objetos através da aplicação de funções. Funções mapeiam simbolos em outros simbolos. Uma fórmula é uma função. Tomemos por exemplo o famoso teorema de Pitágoras, que relaciona os lados de um triângulo retângulo qualquer. Ao arbritar dois lados, podemos aplicar a fórmula obtendo o terceiro. Neste momento teremos definido um triângulo retângulo em um modelo simbólico. Obtivemos um objeto a partir da aplicação da fórmula em alguns dados. Esta é uma ação típica que somos capazes de realizar por ter aprendido a fórmula.

Coloque-se agora um pouco no lugar de PitÃ¡goras antes de haver desnvolvido seu teorema. Ele possuia dados, valores de triÃ¢ngulos retangulos. Mas nÃ£o havia a funÃ§Ã£o que relacionava estes dados. Sua tarefa, foi portanto, obter a funÃ§Ã£o a partir dos dados. Uma fÃ³rmula Ã© composta de uma ou mais operaÃ§Ãµes, que tranformam os dados.

Podemos dizer que a aÃ§Ã£o de um programa de aprendizagem automÃ¡tica Ã© desenvolver novas fÃ³rmulas, a partir de dados. Uma abordagem pode ser a de criar uma funÃ§Ã£o que opera em todos os dados disponÃveis de vÃ¡rios objetos. Se eles forem triÃ¢ngulos retangulos, que seja criada uma funÃ§Ã£o que opera em todos os catetos. Estas operaÃ§oes podem ser inicialmente quaisquer operaÃ§Ãµes, desconhecemos as operaÃ§Ãµes verdadeiras.

Num passo seguinte, aplicamos nosa fÃ³rmula a dados de catetos. Muito provÃ¡velmente esta fÃ³rmula criada ao acaso vai errar. Neste momento verificamos o quÃ£o errado a fÃ³rmula estÃ¡, comparado o valor da hipotenusa calculada com o valor da hipotenusa verdadeira. Desta diferenÃ§a obtemos o valor de erro. este valor pode ser usado para realizar um refinamento na formula, e aÃ, repetimos o processo, tentando obter um erro cada vez menor, atÃ© que teremos uma fÃ³rmula exata. SerÃ¡ que PitÃ¡goras poderia ter sido um programa de computador?

Aprendizagem de mÃ¡quina Ã© aplicada em vÃ¡rias atividades, vejamos alguns exemplos, dentre muitos existentes.

Sistemas de recomendaÃ§Ã£o 👍 . Utilizados por sites de venda, como a Amazon, para recomendar compras baseadas nas escolhas dos usuÃ¡rios comparados mutuamente. Ou em serviÃ§os de stream, como o Netflix ou o Prime. Observem a complexidade de considerar que, ao classificar o filme A como um bom filme, o usuÃ¡rio deverÃ¡ gostar tambÃ©m do filme B. Ora, apesar de podermos classificar um filme pelo gÃªnero (aÃ§Ã£o, romance, etc), a qualidade de um filme Ã© determinada por fatores muito mais profundos. Pode ser a mÃºsica do filme, o estilo do diretor, os atores, seus desempenhos, o estilo da narrativa. E ainda Ã© preciso classificar usuÃ¡rios como de gosto semelhantes, e desta forma poder recomendar um filme que o usuÃ¡rio A gostou para o usuÃ¡rio B. Em sÃntese, sÃ£o tantos fatores a considerar que fica muito difÃcil criar uma formula cheia de calculo.
Carros semi e auto dirigÃveis 🚗. Empresas como o Google, Tesla, Uber, para mencionar algumas, jÃ¡ estÃ£o testando, na prÃ¡tica em em tempo real, carros semi ou auto dirigÃveis, em algumas cidades. Dirigir Ã© uma atividade complexa, que precisa levar em consideraÃ§Ã£o um grande nÃºmero de fatores. Um programa de computador que deseja aprender a dirigir, de maneira semelhante a como uma pessoa aprende, deve ser capaz de levar em consideraÃ§Ã£o a observaÃ§Ã£o visual da estrada, deve prever as aÃ§Ãµes de outros motoristas, deve observar a sinalizaÃ§Ã£o, deve considerar informaÃ§Ãµes sonoras. A lista de fatores que influenciam cada aÃ§Ã£o de acelerar, reduzir, parar, controlar o volante, etc, Ã© muito grande. Imagine se tivÃ©ssemos que ensinar uma pessoa a dirigir, mas que esta pessoa nunca andou de carro, nem mesmo sabe o que Ã© um carro. E se tivÃ©ssemos que ensinar dentro de uma sala, sem prÃ¡tica, sem imagens, sÃ³ descrevendo o que pode acontecer, o que deve ser feito diante de cada evento ... Seria uma tarefa talvez impossÃvel. Em termos de computaÃ§Ã£o, isto seria programar especificamente para a realizaÃ§Ã£o de uma tarefa. Por outro lado, na verdade as pessoas aprendem inicialmente observando alguma outra pessoa dirigir. Depois, comeÃ§am a praticar, em geral em um local especialmente seguro, e cometem erros, e aprendem com estes erros. O equivalente disto para um programa de computador seria aprender observando filmes de alguÃ©m dirigindo, e depois simular o ato de dirigir comeÃ§ando em um ambiente virtual, atÃ© conseguir igualar, e se possÃvel ter desempenho melhor, do que os motoristas observados. Isto seria um programa aprendendo algo sem ter sido especificamente instruÃdo sobre o que fazer exatamente.
DiagnÃ³stico de enfermidades, como o cÃ¢ncer 🏥. Muitas doenÃ§as graves, se diagnosticadas a tempo, podem ser tratadas com mais eficiÃªncia, evitando danos mais graves e Ã³bitos precoces. Recentemente uma sÃ©rie de televisÃ£o chamada House fez bastante sucesso. Mostrava as atividades de uma equipe especializada em diagnÃ³stico de um grande hospital. O foco da sÃ©rie era a grande dificuldade de diagnosticar certas patologias. Isso exige grande capacidade do especialista. Por mais que estude, pelas limitaÃ§Ãµes humanas, um mÃ©dico nÃ£o consegue aprender tudo que seria bom saber. Um programa de computador capaz de aprender, na presenÃ§a de dados histÃ³ricos, pode atingir nÃveis de conhecimentos sem precedentes. Programas de aprendizagem automÃ¡tica tÃªm ultrapassado a eficiÃªncia de pessoas em vÃ¡rias abordagens.
DetecÃ§Ã£o de atividades fraudulentas na Internet 😈. Sites de serviÃ§os, como bancos, sites de venda, sÃ£o muito visados por fraudadores. Programas que podem aprender a identificar aÃ§Ãµes fraudulentas possuem grande demanda.
Jogos 🎲. Programas de aprendizagem automÃ¡tica tÃªm apresentado resultados expressivos aprendendo jogos, como xadrez e go. Mas sÃ£o utilizados com sucesso em jogos de computador, onde a informaÃ§Ã£o deve ser obtida atravÃ©s de imagens. Jogos exigem uma forma de aprendizagem especial, diferente de, por exemplo, aprender a classificar uma imagem, onde sÃ³ existe uma classificaÃ§Ã£o certa, as outras sÃ£o erradas. No jogo existe o cenÃ¡rio e um conjunto de aÃ§Ãµes disponÃveis. O jogador, seja pessoa ou mÃ¡quina, tem um objetivo, ganhar o jogo. O problema Ã© que quase nunca existe apenas uma aÃ§Ã£o certa. O jogador pode ir em frente, virar a esquerda, virar a direita ... e isso nÃ£o faz diferenÃ§a imediata. SÃ³ apÃ³s executar um numero nem sempre pequeno de aÃ§Ãµes, as consequÃªncias comeÃ§am a aparecer. Para aprender a jogar, um programa tem que ser capaz de experimentar e avaliar o resultado de longas tomadas de decisÃ£o.

Aprendizagem pela observaÃ§Ã£o

Podemos dizer que a aprendizagem de mÃ¡quina se situa na fronteira da computaÃ§Ã£o e da estatÃstica. A estatÃstica Ã© a ciÃªncia especializada em coletar, observar, classificar e determinar aÃ§Ãµes pela anÃ¡lise de dados. Utiliza bastante os conhecimentos de probabilidade para isso.

Aprender por observaÃ§Ã£o demanda quantidades muito grandes de dados histÃ³ricos, que mostrem claramente o que deve ser feito, com exemplos tanto de sucessos, como de fracassos.

Uma observaÃ§Ã£o aqui, com relaÃ§Ã£o a graduaÃ§Ã£o de engenharia da computaÃ§Ã£o, Ã© que naturalmente sÃ£o cursos que estudam computaÃ§Ã£o e estatÃstica, com uma noÃ§Ã£o de matemÃ¡tica bÃ¡sica bastante completa.

Classificando objetos

Olhe por exemplo uma crianÃ§a pequena. AlguÃ©m aponta um objeto para ela e diz algo como: "Olhe, um au-au!", ou entÃ£o, - "Ali, um carro!", e assim por diante. Algum tempo depois, a crianÃ§a comeÃ§a a mencionar o nome dos objetos quando os vÃª. A crianÃ§a aprendeu o nome dos objetos e Ã© capaz de classificÃ¡-los com sucesso atÃ© certo ponto.

Alguns aspectos do processo de aprendizagem podem ser destacados:

Mostrar e rotular. AlguÃ©m apenas precisa mostrar e rotular (informar o nome) do objeto.
Sem destaque para as caracterÃsticas. NÃ£o Ã© necessÃ¡rio ensinar quais as caracterÃsticas do objeto que devem ser usadas na classificaÃ§Ã£o, funciona mesmo assim. NÃ£o se tenta explicar a uma crianÃ§a pequena o que Ã© um carro, como ele funciona, o que Ã© o motor, combustÃvel, dizer que tem rodas, como funcionam as rodas ... espera-se que ela aprenda apenas vendo e ouvindo o nome.
Aprendizagem capaz de ser generalizada. A crianÃ§a consegue, apÃ³s o devido tempo, classificar com relativo sucesso objetos diferentes da mesma classe. NÃ£o Ã© necessÃ¡rio ensinar separadamente cada carro, como o carro da famÃlia dela, o do vizinho, o de cada pessoa. Ela vai generalizando, sendo capaz de saber que Ã© um carro, sem ter sido especificamente instruÃda a isso, vÃ¡rias marcas e modelos de carro, com tamanho, forma e cores diferentes. Mesmo havendo diferenÃ§as, ela reconhece e classifica os objetos como carros, identifica como au-au cachorros diferentes, de raÃ§a, de aparÃªncia diferente.

Podem computadores classificar objetos a partir da observaÃ§Ã£o de imagens, como as pessoas fazem?

CÃ³digo de computador sÃ£o conjuntos de instruÃ§Ãµes. As instruÃ§Ãµes sÃ£o estritas e simples, sÃ£o operaÃ§Ãµes matemÃ¡ticas aplicadas a dados numÃ©ricos, como por exemplo - "some isto e armazene ali", - "compare estes e decida o que fazer baseado no resultado", - "repita estas operaÃ§Ãµes atÃ© que ...", e assim por diante. NÃ£o Ã© uma tarefa difÃcil ensinar uma crianÃ§a a reconhecer um carro, Ã© sÃ³ apontar e dar o nome. Mas talvez nÃ£o seja tÃ£o fÃ¡cil ensinar um computador a fazer o mesmo atravÃ©s de instruÃ§Ãµes especÃficas de computador. Estes aspectos serÃ£o aprofundados e discutidos na evoluÃ§Ã£o deste texto. Mas por ora, podemos considerar a dificuldade que terÃamos de expressar as propriedades (ou caracterÃsticas) dos componentes de um carro que permitissem seu correto reconhecimento e classificaÃ§Ã£o: Tem que ter esta cor, tem que ter esta forma, etc, e ao dizermos isto para alguÃ©m que nunca viu um carro, a pessoa chega a conclusÃ£o que um besouro Ã© um carro! Se apenas pensarmos sobre isso veremos que nÃ£o Ã© uma tarefa fÃ¡cil. Porque talvez possamos dizer que somos capazes de reconhecer um carro, mas nÃ£o sabemos bem descrever como o fazemos. Uma das razÃµes pode ser especulada de algumas pesquisas de ponta sobe o funcionamento do cÃ©rebro humano. Estas pesquisas afirmam que nossos cÃ©rebros nÃ£o processam informaÃ§Ãµes com uma Ãºnica e linear sÃ©rie de operaÃ§Ãµes, mas, ao invÃ©s disto, utiliza vÃ¡ria Ã¡reas de processamento separadas, algumas bem especializadas em fazer determinados tipos de operaÃ§Ãµes, diferentes de outras. e mais, estas operaÃ§Ãµes Ã s vezes ocorrem de forma concorrente, e ainda ocorrem tanto em Ã¡reas conscientes como em Ã¡reas inconscientes de nosso cÃ©rebro. Como resultado disto, podemos estar conscientemente tentando falar o nome do objeto que avistamos, e de repente, no meio deste pensamento surge do nada a palavra carro, sem termos consciÃªncia do que aconteceu para chegarmos a esta conclusÃ£o. E tudo isto tÃ£o rÃ¡pido, que sem refletir jÃ¡ estamos pensando em outra coisa. Podemos resumir em: Sabemos fazer, mas nÃ£o sabemos como fazemos!

Cientistas da computaÃ§Ã£o vÃª tentando vÃ¡rias abordagens para realizar reconhecimento de objetos, no campos mais geral da inteligÃªncia artificial. Houve algum sucesso na utilizaÃ§Ã£o de segmentaÃ§Ã£o de um objeto em suas caracterÃsticas (propriedades), mas com pouco efeito generalizado. Ã� aÃ que o aprendizado automÃ¡tico tem recebido esforÃ§o de desenvolvimento, e tem apresentado alguns resultados promissores. Vamos aprender que um algoritmo de reconhecimento realiza seu trabalho selecionando algumas caracterÃsticas. Mas,Ã medida que evoluem, nÃ³s nÃ£o temos ideia exata de quais sÃ£o as caracterÃsticas selecionadas. Provavelmente, um grande nÃºmero, e tambÃ©m, uma grande combinaÃ§Ã£o delas. NÃ£o necessariamente algo evidente como rodas, cantos e para-brisas.

Separar para classificar

Para classificar, reconhecer objetos, precisamos ser capazes de comparÃ¡-los, e isto equivale a separÃ¡-los. Pegue por exemplo duas cidades. VocÃª separa o que pertence a uma cidade do que pertence a outra desenhando um mapa das cidades onde existe uma linha fronteiriÃ§a entre elas. Que sejam Vassouras e Barra do PiraÃ. Desta forma, as pessoas que moram de um lado da fronteira pertencem a Vassouras e quem mora do outro pertencem a Barra do PiraÃ. O problema Ã© que, mesmo em duas dimensÃµes, desenhar fronteira pode ser complicado. Dificilmente vai ser uma linha reta. Mais provÃ¡vel mente vai ser uma linha bastante irregular, seguindo preferencialmente detalhes de fenÃ´menos geogrÃ¡ficos, como rios, montanhas. E ainda, fenÃ´menos demogrÃ¡ficos, como casas, ruas, estradas e propriedades rurais. Mas vamos comeÃ§ar da forma mais simples possÃvel.

uma dimensÃ£o.

Em uma dimensÃ£o sÃ³ existe o ponto.

duas dimensÃµes.

Em duas dimensÃµes passamos a ter o plano. Podemos colocar dois pontos sobre um plano de estabelecer suas posiÃ§Ãµes com coordenadas cartesianas. Em seguida, podemos definir uma linha reta, novamente com coordenadas cartesianas, de tal forma que ela separe os dois pontos. Algo como: Deste lado estÃ¡ o ponto A, e deste outro estÃ¡ o ponto B.

Vamos ilustrar um pouco melhor a separaÃ§Ã£o de pontos com uma linha reta. Imagine um grÃ¡fico cartesiano (em azul), como na Figura 1. Imagine a ocorrÃªncia de dois grupos de valores, os pontos verdes e os vermelhos.

EntÃ£o, vocÃª traÃ§a uma linha preta para separar os dois grupos de valores, como na Figura 2.

Ã� preciso girar o sentido da linha separadora para uma posiÃ§Ã£o mais adequada, veja a Figura 3.

VocÃª vÃª que apenas girar nÃ£o Ã© suficiente para a melhor separaÃ§Ã£o. Deslocar a linha separadora permite melhor resultado, como mostra a Figura 4.

Figura 1	Figura 2	Figura 3	Figura 4
[[https://github.com/duodecimo/duodecimoMachineLearning/blob/master/images/cartesianClustersSeparation01.png	width=200px	height=200px	align=center

Para posicionar a reta convenientemente separando os pontos de cores diferentes, precisamos em primeiro lugar definir uma equaÃ§Ã£o de uma reta no plano cartesiano.

A equaÃ§Ã£o geral da reta: ** ax + by + c = 0**.

Se vocÃª escolher originalmente uma reta que fica exatamente sobre um dos eixos cartesianos, para deslocÃ¡-la de forma que separe os pontos de cores diferentes, vocÃª deseja fazer dois tipos de operaÃ§Ã£o geomÃ©trica, rotaÃ§Ã£o e translaÃ§Ã£o. RotaÃ§Ã£o, com diz o nome, faz a reta rodar mudando de Ã¢ngulo com relaÃ§Ã£o aos eixos cartesianos X e Y. Alterar os valores das constantes a e b na equaÃ§Ã£o geral da reta causa rotaÃ§Ã£o. Mas sÃ³ mudando a rotaÃ§Ã£o, a reta sempre passa sempre pela origem, ou seja, pelos pontos x=0 e y=0. Para transladar a reta, alteramos a constante c. Se c Ã© diferente de zero, a reta nÃ£o passa pela origem.

Continuemos pensando. Se os objetos estÃ£o em dois grupamentos distintos, uma reta pode separÃ¡-los. A medida em que se misturarem, podemos precisar de uma linha curva. Na verdade, a reta pode ser considerada como um caso especial de uma curva, no sentido que poderÃamos definir uma reta com a equaÃ§Ã£o da curva.

Outra possibilidade Ã© traÃ§ar retas e curvas para separar trÃªs ou mais tipos de objetos. Vamos usar o termo linhas. Dadas linhas suficientes, podemos separar qualquer quantidade de objetos diferentes num plano.

trÃªs dimensÃµes

Linhas nÃ£o sÃ£o suficientes para separar objetos em trÃªs dimensÃµes. Para prosseguir com este pensamento, vamos propor utilizar sacos. SÃ³ que nÃ£o podemos pegar os objetos e simplesmente colocar em sacos diferentes, um para cada tipo de objeto. Ao fazer isso, estarÃamos mudando a posiÃ§Ã£o dos objetos. O que queremos Ã© mudar a posiÃ§Ã£o dos sacos. Vamos entÃ£o imaginar um saco muito especial: tem que ser flexÃvel, de forma que possamos ir esticando e fazendo a boca dele envolver cada objeto do tipo que ele separa, quando a boca do saco passar por todos os objetos, damos um nÃ³ fechando-a. Com sacos suficientes, podemos separar qualquer quantidade de objetos em um espaÃ§o de trÃªs dimensÃµes. Mas, qual o material para este tipo de saco? Afinal, quanto mais tipos de objetos e quÃ£o mais espalhados eles tiverem, mais flexÃvel o saco precisa ser para podermos realizar a tarefa, temos que ir esticando, esticando. Poderia ser lÃ¡tex? Bom, lÃ¡tex Ã© flexÃvel, mas tem limites. Se esticar demais, pode rasgar. Como sÃ³ estamos imaginando, vamos entÃ£o imaginar um novo tipo de material: espacex, feito de espaÃ§o, de tecido temporal. Esticando nossos sacos de espacex tranquilamente poderÃamos separar todos os objetos. Mesmo se forem os planetas e as estrelas. E as equaÃ§Ãµes? Sim, Ã© possÃvel perfeitamente definir uma equaÃ§Ã£o com trÃªs dimensÃµes para o saco de espacex que permita verificar, dadas as coordenadas espaciais em trÃªs dimensÃµes de um objeto, em qual saco ele estÃ¡. Ã� sÃ³ uma operaÃ§Ã£o geomÃ©trica. Claro que pode ficar muito complexa, mas pode perfeitamente ser calculado.

quatro dimensÃµes

Agora que comeÃ§a a ficar interessante. NÃ³s vemos o mundo em trÃªs dimensÃµes, pelo menos aparentemente. Para preparar a imaginaÃ§Ã£o, seria bastante Ãºtil ler o livro Flatland: A Romance of Many Dimensions by Edwin Abbott Abbott. (Estamos informando o link em inglÃªs no Project Gutenberg que Ã© um site onde podemos encontrar livros que caÃram no domÃnio pÃºblico, sem restriÃ§Ãµes e sem custo. Os livros sÃ£o oferecidos em muitos formatos, como texto, html, para leitores como kindle ou epub. Existem Ã s vezes traduÃ§Ãµes para outros idiomas. Ã© sÃ³ verificar).

Em uma ocasiÃ£o o matemÃ¡tico Riemann, discÃpulo de Gauss, um dos maiores matemÃ¡ticos de todos os tempos, demonstrou em um artigo o cÃ¡lculo da diagonal do cubo com quatro dimensÃµes, denominado de tesseract.

tesseract

Na verdade, podemos com calculos geomÃ©tricos calcular e verificar em quais sacos de espacex se encontram objetos definidos em quatro dimensÃµes. Apenas o cÃ¡lculo Ã© bem mais complexo que o cÃ¡lculo com trÃªs dimensÃµes. PorÃ©m, sÃ³ o que aumenta Ã© o nÃºmero de operaÃ§Ãµes necessÃ¡rias, daÃ a complexidade. As operaÃ§Ãµes em si sÃ£o basicamente as mesmas.

mÃºltiplas dimensÃµes

Finalizando o exercÃcio de imaginaÃ§Ã£o, o cÃ¡lculo pode ser feito para sacos de espacex em quantas dimensÃµes desejarmos. Na verdade, a verdadeira dificuldade com que precisamos lidar para realizar a separaÃ§Ã£o de dados perfeita, em mÃºltiplas dimensÃµes (considere que as informaÃ§Ãµes que podemos obter sobre, por exemplo, um filme, como gÃªnero, subgÃªneros, atores, opiniÃµes, crÃtica, duraÃ§Ã£o, ano em que foi feito, prÃªmios, etc, cada uma Ã© uma dimensÃ£o), a verdadeira dificuldade Ã© a quantidade de operaÃ§Ãµes que temos que realizar.

Os computadores evoluÃram e evoluem em sua capacidade de realizar grandes quantidades de cÃ¡lculos. Discutiremos a seguir como a evoluÃ§Ã£o dos computadores impacta a capacidade de maior aprendizagem dos programas de aprendizagem automÃ¡tica.

Aprendizagem de Máquina - Duodécimo Fernandes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Inicio

Aprendizagem de Máquina

Tabela de conteúdo:

Introdução

Aprendizagem pela observaÃ§Ã£o

Classificando objetos

Podem computadores classificar objetos a partir da observaÃ§Ã£o de imagens, como as pessoas fazem?

Separar para classificar

uma dimensÃ£o.

duas dimensÃµes.

trÃªs dimensÃµes

quatro dimensÃµes

mÃºltiplas dimensÃµes

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Summary

Clone this wiki locally