‘Machine Learning Stage Table’ Ai pode melhorar a invenção

‘Machine Learning Stage Table’ Ai pode melhorar a invenção

Os pesquisadores do MIT criaram uma tabela periódica que mostra como mais de 20 algoritmos clássicos de aprendizado de máquina estão conectados. A nova estrutura se concentra em como os cientistas podem fundir as técnicas de diferentes métodos para melhorar os modelos de IA existentes ou trazer novos.

Por exemplo, os pesquisadores usaram sua estrutura para criar um novo algoritmo de classe de imagem para combinar os elementos de dois algoritmos separados, que tiveram um desempenho 8 % melhor que o método sofisticado atual.

A tabela periódica é derivada de uma idéia -chave: todos esses algoritmos aprenderam um certo tipo de relação entre os pontos de dados. Embora cada algoritmo possa executá -lo de uma maneira ligeiramente diferente, a matemática original por trás de cada método é a mesma.

Com base nessas idéias, os pesquisadores identificaram uma equação uniforming que desfruta de muitos algoritmos clássicos de IA. Eles usaram essa equação para reconsiderar os métodos populares e classificá -los em uma mesa, categorizando cada um com base no relacionamento aproximado que poderia aprender.

Como a tabela periódica de elementos químicos, onde há inicialmente quadrados em branco que mais tarde foram preenchidos por cientistas, a tabela periódica de aprendizado de máquina também tem espaço vazio. Esses espaços prevêem onde os algoritmos devem estar, mas que ainda não foram descobertos.

A tabela fornece um equipamento para projetar novos algoritmos sem a necessidade de reiniciar os conceitos dos pesquisadores, o estudante de pós -graduação do MIT Shaden Alasammi e o principal autor de um artigo sobre essa nova estrutura.

“Isso não é apenas uma metáfora”, acrescentou o Al -Shammi. “Estamos começando a ver o aprendizado de máquina como um sistema que é um lugar que podemos explorar em vez de apenas adivinhar nosso caminho”.

Ele se juntou ao artigo do pesquisador de Persation do Google, John Harshi; Axel Fieldman, estudante de pós -graduação do MIT; William Freeman, Thomas e Jord Parkins Engenharia Elétrica e Professor de Ciência da Computação e Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL); E o autor sênior Mark Hamilton, estudante de pós -graduação do MIT e gerente sênior de engenharia da Microsoft. A pesquisa será apresentada na Conferência Internacional sobre Apresentação de Pesquisa.

Uma equação acidental

Os pesquisadores não estavam prontos para criar uma tabela periódica de aprendizado de máquina.

Depois de ingressar no Freeman Lab, Alasammi começou a estudar o Clustering, uma técnica de aprendizado de máquina que classificou imagens aprendendo a organizar imagens semelhantes no cluster mais próximo.

Ele percebeu que o algoritmo de agrupamento que ele estudava era como outro algoritmo clássico de aprendizado de máquina, conhecido como aprendizado contrastante e começou a se aprofundar na matemática. Alasammi descobriu que esses dois algoritmos separados podem ser rejeitados usando a mesma equação subjacente.

Hamilton diz: “Conseguimos acidentalmente essa equação de unificação. Depois que os Shades descobriram que ela anexou dois métodos, começamos a sonhar com um novo método para trazer essa estrutura. Quase todos os que tentamos poderiam ser acrescentados”, diz Hamilton.

As estruturas que eles criaram, a aprendizagem contrastante da informação (I-Con-) mostra como diferentes algoritmos podem ser vistos através das lentes desta equação de consolidação. Inclui todas as coisas dos algoritmos de classificação que podem detectar spam em algoritmos de educação profunda que o Power LLM.

A equação descreve como esses algoritmos nacionais encontram conexões entre pontos de dados reais e, internamente, essas conexões são estimadas.

Cada algoritmo é notado que ele é aproximadamente e reduz a quantidade de desvio em seus dados de treinamento.

Eles decidiram organizar o I-Cone em uma tabela de fases para categorizar algoritmos com base em como eles estão conectados a casas de dados e algoritmos reais podem se aproximar dessas conexões.

“O trabalho desapareceu lentamente, mas uma vez que identificamos a estrutura geral dessa equação, foi mais fácil adicionar mais métodos à nossa estrutura”, disse Alasamari.

Uma ferramenta para descoberta

Enquanto decoravam a mesa, as lacunas que os pesquisadores poderiam estar presentes foram iniciadas para ver as lacunas, mas que ainda não foram descobertas.

Os pesquisadores concluíram a idéia de uma técnica de aprendizado de máquina chamado aprendizado contrastante e os aplicaram ao agrupamento. Isso criou um novo algoritmo que poderia classificar as imagens rotuladas melhor do que outro método sofisticado.

Eles usaram o I-Connote para mostrar como a técnica de debaging de dados criou para a educação contrastante para aprimorar a precisão dos algoritmos de cluster.

Além disso, a tabela de fases flexível permite que os pesquisadores adicionem novas linhas e colunas para apresentar tipos adicionais de conexões de dados.

No final, os cientistas de aprendizado de máquina como guia podem ajudar os cientistas a pensar fora da caixa, incentivando -os a combinar suas idéias como não pensam o contrário, caso contrário, Hamilton diz.

“Mostramos que apenas uma equação muito elegante, a essência da ciência da informação, oferece 100 anos de pesquisa em aprendizado de máquina que isso é exposto a muitas novas maneiras de descobrir isso”. Ele acrescentou.

Este estudo foi financiado pelo Acelerador de Inteligência Artificial da Força Aérea, pelo Instituto Nacional de Inteligência Artificial da Fundação de Ciências da Ciência e Interação Básica e Computadores Quanta.

Source link