apprendre la bourse et le trading 49
mars 25, 2020 Par bourse 0

les scientifiques des données se mobilisent pour aider les médecins

Alors que le monde est confronté à la pandémie de COVID-19, diverses initiatives voient le jour pour exploiter les talents des analystes, des développeurs d'IA et des ingénieurs de données. Ces initiatives peuvent donner aux individus et aux équipes la possibilité de travailler sur un projet significatif avec d'autres métiers et d'acquérir de nouvelles compétences.

"Il ne fait aucun doute que des modèles statistiques et prédictifs doivent être construits pour servir la communauté scientifique, qui travaille dur pour comprendre le virus, l'efficacité des traitements et développer des vaccins", a déclaré Joshua Swartz, partenaire de transformation numérique de Kearney. , société de conseil en stratégie et management. "Ce que les développeurs peuvent faire, c'est aider la communauté scientifique à faire ces analyses et à donner un sens aux résultats."

De nombreux éditeurs n'hésitent pas à offrir leurs talents.

David Leichner, directeur général de SQream, éditeur d'un entrepôt de données SQL basé sur GPU, affirme que sa société s'appuie sur des efforts volontaires antérieurs dans la recherche sur le cancer et l'analyse d'ADN. Leurs équipes cherchent à trouver des corrélations entre différents indicateurs pour construire un modèle de risque qui prend en compte la démographie, la densité des zones urbaines, le tabagisme, etc.

Tiffany Jachja, évangéliste technique chez Harness, l'éditeur d'une solution de livraison continue en tant que service, explique que son employeur a modifié les tâches de ses développeurs pour concevoir des panneaux pour aider le public à suivre la propagation du coronavirus.

De leur côté, des éditeurs tels que Tableau et Kaggle proposent un tableau de bord pour visualiser la progression de la maladie au jour le jour. SAS a conçu un rapport détaillant de nombreuses statistiques sur le coronavirus. Splunk a adopté la même approche que Tableau et donne accès à une application via GitHub pour recréer la visualisation des données. Cependant, ce n'est pas l'objectif principal des scientifiques de données qui cherchent à avoir un réel impact sur la recherche contre la maladie.

CORD-19, une initiative en réponse au procès de la Maison Blanche

Kaggle COVID-19 Open Research Dataset Challenge ou CORD-19 est sans aucun doute l'un des projets de collecte de données les plus importants. Il a été publié après un appel à l'action de la Maison Blanche. Il rassemble divers projets et possibilités de collaboration pour les analystes de données qui souhaitent aider.

CORD-19 demande aux participants de résoudre les problèmes scientifiques posés par la pandémie en développant des outils d'exploration de données. Ces outils seront utilisés pour extraire des informations pertinentes de diverses sources de données, de milliers d'articles et de rapports scientifiques.

"L'appel a été lancé dans l'espoir que l'IA et d'autres outils puissent être utilisés pour aider à trouver des réponses à un ensemble de questions clés posées par COVID-19", a déclaré Phil Gurbacki, vice-président. produit senior et service client chez DataRobot.

L'ensemble de données brutes rassemble plus de 44 000 articles scientifiques sur divers coronavirus et le séquençage complet de l'ARN du virus. Les chercheurs sont encouragés à aider à résoudre diverses tâches et sous-tâches de haut niveau.

Les tâches de haut niveau comprennent des questions telles que "Que savons-nous de la transmission, de l'incubation et de la stabilité environnementale?" "Les sous-tâches nécessitent des réponses à des questions telles que" quelles sont les périodes d'incubation les plus courantes? "", "Quelle est la saisonnalité de la transmission" et "quelle est la prévalence de la transmission asymptomatique?"

EndCoronavirus rassemble plus de 2 100 volontaires

L'initiative EndCoronavirus a été lancée par le New England Complex Systems Institute (NECSI) et ses collaborateurs dans le but de minimiser l'impact du virus. L'objectif est de fournir des données utiles et des recommandations pour l'action à mettre en œuvre. Il est rapidement devenu plus de 2 100 bénévoles qui continuent d'affluer.

Les participants ont la possibilité d'affiner leurs compétences en analyse de réseau, en modélisation basée sur les agents, en analyse multi-échelles et en analyse de complexité.

Stephanie So, fondatrice et CDO de Geeq, une startup de blockchain, explique que son équipe travaille depuis Slack sur ce projet. Les membres utilisent une variété d'outils mathématiques conçus pour des systèmes qui interagissent avec de nombreux éléments pour tester les hypothèses des statistiques traditionnelles.

Données agrégées, un sacerdoce

D'autres groupes travaillent sur la collecte de données qui pourraient être utiles pour différents types d'analyses et le développement de nouvelles applications dans le contexte de cette crise.

«La crise des coronavirus a mis en évidence la façon dont différents groupes dotés de capacités uniques peuvent travailler ensemble de manière distribuée très rapidement», a déclaré Andrew Eye, PDG et co-fondateur de ClosedLoop.ai, une plateforme de données des sciences de la santé.

Andrew Eye rappelle l'importance du travail d'agrégation de données effectué par Worldometer COVID-19 et l'Université John Hopkins, qui met régulièrement à jour les ensembles de données et fournit un tableau de bord disponible à partir de GitHub créé avec l'éditeur SIG Esri. Ils sont hébergés gratuitement sur AWS.

Qlik est membre de la Table ronde du secteur privé, un groupe d'entreprises travaillant avec l'OMS et le Centre américain de contrôle et de prévention des maladies. Par conséquent, Qlik a accès à des cliniques, des laboratoires pharmaceutiques et des fabricants d'appareils médicaux dont les informations peuvent être cruciales pour comprendre et combattre la pandémie.

«Nous pouvons fournir les données qui nous permettront de lutter contre la pandémie et de l'arrêter, puis, à l'avenir, de contribuer à la mise en place de systèmes de santé exemplaires», explique Julie Kae, directrice de Qlik.org, la division philanthropique de l'éditeur.

Des supercalculateurs fortement mobilisés

Plusieurs laboratoires gouvernementaux et fournisseurs de cloud privé, dont IBM et AWS, mettent leurs HPC à la disposition des analystes de données via le consortium COVID-19 HPC. Les organisateurs mettent à votre disposition plus de 330 pétaflops, 775 000 cœurs de processeur et 34 000 GPU (et ce n'est pas encore terminé).

Ce programme fournit également une assistance technique et des crédits promotionnels dans les services cloud nécessaires à l'exécution de ces charges de travail. Par exemple, Amazon a permis aux chercheurs travaillant sur des projets urgents d'utiliser AWS pour accéder instantanément à une capacité d'infrastructure pratiquement illimitée.

Gratuit pour les chercheurs

De nombreux autres éditeurs mettent également leurs outils et ressources à disposition des projets COVID-19. TigerGraph, un éditeur de base de données Graph, met ses services à la disposition de toute personne ou organisation participant à ce combat.

De plus, Nvidia offre aux chercheurs son progiciel Parabricks dédié à l'analyse génomique et optimisé pour fonctionner avec ses processeurs graphiques.

DataRobot offre aux chercheurs leur apprentissage automatique et Préparation des données Paxata.

"Les développeurs, les scientifiques et les autres membres de la communauté technique peuvent commencer à s'impliquer dans la lutte contre les coronavirus en profitant du grand nombre de plateformes et d'outils mis à la disposition du public", a déclaré Phil Gurbacki.

Le Deep Learning Coronavirus Cure vise à utiliser le Deep Learning pour générer de nouvelles molécules comme candidats pour la guérison du nouveau virus. OpenCovid19, quant à lui, travaille sur divers outils d'analyse des données et du monde réel pour tester le virus en toute sécurité à l'aide d'outils courants.