Thématiques principales

samedi 28 juillet 2018

IA: DataSet et Concours

Aujourd'hui, un article court que je nommerai utilitaire afin de ne pas voir a courir a travers tout le net pour trouver des données ou chercher un concours pour s'exercer.

Donc tout d'abord une petite liste de datasets et de pages associées afin de les récupérer. En effet, si on veut faire de l'IA, le nerf de la guerre c'est les datas... et comme on dit, pour entraîner un bon modèle, il vaut toujours mieux une bonne base de données qu'un bon algorithme....

Ensuite des concours, oui car les concours en IA sont une manière d'apprendre, comprendre et s’améliorer (je parle du programmer de l'IA, pas de l'IA.... quoi qu'il serait intéressant de faire de voir si une IA, ne produirai pas mieux que nous une IA....)

Enfin bref, voila une première liste que je tenterai de compléter au fil de l'eau et des propositions:

Les DataSets

  • Machine Learning Repository : https://archive.ics.uci.edu/ml/index.php
  • AWS: https://registry.opendata.aws/
  • Kaggle : https://www.kaggle.com/uciml
  • AI-Wiki : https://skymind.ai/wiki/open-datasets
  • Les DataSets les plus connus: https://www.analyticsvidhya.com/blog/2018/03/comprehensive-collection-deep-learning-datasets/
  • DataPortals : http://dataportals.org
  • DataMonitor: http://opendatamonitor.eu
  • QuandL: http://quandl.com
  • Des datasets sur GitHub : https://www.kdnuggets.com/2016/05/top-10-datasets-github.html
  • Une liste de resources complementaire: https://blog.bigml.com/list-of-public-data-sources-fit-for-machine-learning/
  • Liste Wikipedia https://en.wikipedia.org/wiki/List_of_datasets_for_machine_learning_research
  • Quoras : https://www.quora.com/Where-can-I-find-large-datasets-open-to-the-public
  • Reddit: www.reddit.com/r/datasets
  • Paris : https://opendata.paris.fr/explore/?sort=modified

Les Concours

  • Kaggle : https://www.kaggle.com/competitions
  • ChallengeData : https://challengedata.ens.fr/fr/season/4/challenge_data_2018.html
  • Bee: http://bee-o-diversity-challenge.strikingly.com/
  • Chalearn: http://www.chalearn.org/
  • CodaLab: https://competitions.codalab.org/
  • Des exercices: https://www.hackerrank.com/domains/ai

Voila, ce n'est pas exhaustif et honnêtement je n'ai pas regarder dans le détails, mais bon cela suffira pour les premiers besoins en données et exercices.

Aucun commentaire:

Enregistrer un commentaire