Leçon 2.3 Introduction de la Science Ouverte et ses concepts fondamentaux

Qu’est-ce que la Science ouverte?

Les concepts du domaine public, les licences ouvertes et libres et les licences Creative Commons vus dans le chapitre précédent partagent le postulat philosophique de l’ouverture, pour lequel les avantages pour la société sont maximisés et distribués de manière égale lorsque les connaissances peuvent circuler librement. Un tel postulat s’applique également à la Science, où l’accès ouvert aux matériaux et aux résultats des études scientifiques revêt une importance primordiale non seulement pour la diffusion d’études scientifiques à la société civile, mais aussi pour améliorer la fiabilité des découvertes scientifiques : accès ouvert à la science, aux ressources permettent la réplication et la reproductibilité des études.

En outre, l’avènement de l’Internet et des technologies numériques augmente et étend l’ouverture de la Science à de nouvelles façons. En fait, les scientifiques de nos jours peuvent facilement échanger des données, commenter des études, partager leurs propres publications à l’aide d’Internet et utiliser des outils et des plates-formes numériques.

Un tel nouveau paradigme s’appelle Open Science (Science ouverte) : son développement a été renforcé par les récents appels à la gouvernance mondiale des sciences auprès des institutions européennes qui ont considéré la transition vers Open Science comme une étape fondamentale pour favoriser la circulation de la connaissance en tant que moteur d’une innovation plus rapide et plus large ( http://ec.europa.eu/programmes/horizon2020/en/h2020-section/open-science-open-access ; https://www.fosteropenscience.eu/content/open-science-scientific-research )

Le mouvement Open Science est au début de sa vie, et aucune définition officielle n’est encore communément acceptée. Les communautés scientifiques, en collaboration avec les institutions, ont entamé un dialogue pour construire une infrastructure commune qui permettra aux scientifiques, aux entreprises et aux citoyens d’accéder à un bassin commun de ressources scientifiques : on l’appelle le Nuage Science Ouverte. Cependant, le développement du Nuage Science Ouverte, qui sera l’application la plus pertinente du paradigme Science ouverte, prendra encore quelques années. Pendant ce temps, il sera important de se préparer à ses concepts fondamentaux bien établis. En particulier, le Libre accès et les Données libres restent deux piliers importants.

Libre accès

Selon Peter Suber, le Libre accès (Open Access OA) se réfère à la production en ligne de la recherche scientifique qui ne comporte pas de restrictions sur leur accès (Ex. Les barrières d’accès) et sans restrictions d’utilisation (Ex. Certaines restrictions sur les droits d’auteur et les licences) (Suber, Peter. Access Overview, 2011).

Le programme européen de financement Horizon 2020 (le programme le plus pertinent pour la recherche en Europe) a récemment fourni des lignes directrices sur le Libre accès aux publications scientifiques et aux données de recherche qui exigent que « chaque bénéficiaire doit assurer un Libre accès à toutes les publications scientifiques évaluées par des pairs sur ses résultats ». Ce mandat d’OA est mis en œuvre en deux étapes, ce qui peut ne pas être simultané :i) déposer des publications dans des dépôts, ii) fournir un Libre accès à celles-ci.

En ce qui concerne la première étape, les chercheurs peuvent se référer à l’infrastructure du Libre accès pour la recherche en Europe (OpenAIRE) pour trouver un référentiel approprié (les archives autorisées sont des dépôts institutionnels, sujets ou centralisés); les dépôts qui revendiquent des droits sur des publications déposées et / ou empêchent l’accès ne sont pas des options d’archivage valides. D’autres listes utiles de dépôts sont le registre des référentiels Libre accès (ROAR) et le répertoire des dépôts Libre accès (OpenDOAR). Un dépôt OA bien connu, par exemple, est ZENODO.

La deuxième étape peut être effectuée en ouvrant le texte intégral de l’élément dans le référentiel choisi (« Libre accès vert ») ou en publiant les travaux de recherche dans les revues Libre accès (« Open »). Les journaux dits « hybrides » sont également une option valable (c.-à-d. Les revues qui, même si elles utilisent un modèle de revenu basé sur l’abonnement, offrent également la possibilité de fournir un libre accès pour des articles individuels, pourvu que les frais de traitement d’article soient payés).

Là où choisit le Libre accès vert (via un référentiel), les bénéficiaires doivent assurer le Libre accès à l’article au plus 6 mois en science, technologie, ingénierie et médecine (STEM) et 12 mois pour les articles en sciences humaines et sociales (HaSS). Les bases de données Sherpa RoMEO sont disponibles dans les bases de données des éditeurs et des revues individuelles en matière d’auto-archivage (dépôt d’articles dans les dépôts), y compris les périodes d’embargo requises (http://www.sherpa.ac.uk/romeo/search.php).

Données libres

Les données libres sont des données pouvant être facilement accessibles, utilisées, modifiées et partagées par n’importe qui pour n’importe quel but – sujet uniquement, au plus, aux exigences d’attribution et / ou de partage. Par rapport aux cadres propriétaires, les données libres sont caractérisées du point de vue juridique et technique – par des restrictions de niveau inférieurs appliquées à leur circulation et à leur réutilisation. Cette fonctionnalité devrait finalement favoriser la collaboration, la créativité et l’innovation.

Selon la définition libre, pour être des données libres, les données doivent être :

légalement libre : c’est-à-dire disponible sous une licence ouverte (données) qui permet à quiconque d’accéder librement, de réutiliser et de redistribuer;
techniquement libre : c’est-à-dire que les données ne sont disponibles que pour le coût de la reproduction et sur la forme lisible par machine et en vrac (http://opendatahandbook.org/glossary/en/terms/open-data/).

Le Manuel de données libres décrit trois caractéristiques principales pour que les données soient libres :

Disponibilité et accès : les données doivent être disponibles dans leur ensemble et à un coût de reproduction raisonnable, de préférence en téléchargeant sur Internet. Les données doivent également être disponibles sous une forme pratique et modifiable.
Réutilisation et redistribution : les données doivent être fournies sous des termes qui permettent la réutilisation et la redistribution, y compris le mélange avec d’autres ensembles de données.
Participation universelle : tous doivent pouvoir utiliser, réutiliser et redistribuer – il ne devrait pas y avoir de discrimination contre les champs d’activité ou contre les personnes ou les groupes. Par exemple, les restrictions « non commerciales » qui empêcheraient l’utilisation « commerciale » ou les restrictions d’utilisation à des fins déterminées (par exemple uniquement dans l’enseignement) ne sont pas autorisées.

Un concept clé pour comprendre ce qu’est une donnée libre est l’interopérabilité. L’interopérabilité désigne la capacité de divers systèmes et organisations à travailler ensemble (inter-opérer). Dans ce cas, c’est la capacité d’inter-opérer – ou de mélanger – des jeux de données différents. L’interopérabilité est importante car elle permet aux différents composants de travailler ensemble. Cette capacité à composer et à « raccorder » des composants est essentielle pour construire des systèmes complexes et complexes. Sans interopérabilité, cela devient presque impossible – comme en témoigne le mythe le plus célèbre de la Tour de Babel où la capacité de communication (pour inter-opérer) a entraîné la rupture complète de l’effort de construction de la tour.

Nous sommes confrontés à une situation similaire en ce qui concerne les données. Le noyau de ce qui est « commun » en termes de données (ou de code) est que l’un des éléments « libre » peut être librement mélangé à d’autres éléments « libres ». Cette interopérabilité est absolument essentielle pour réaliser les principaux avantages pratiques de l’ouverture : la capacité considérablement améliorée de combiner différentes données ensemble et de développer ainsi de meilleurs produits et services (ces avantages sont discutés plus en détail dans la section «pourquoi» données ouvertes). Il faut distinguer entre l’interopérabilité juridique, l’interopérabilité technique et l’interopérabilité sémantique (F.Morando, https://www.jlis.it/article/view/5461).

Une définition simple de l’ouverture garantit que lorsque vous obtenez deux ensembles de données libres à partir de deux sources différentes, vous pourrez les combiner ensemble, et cela vous garantit que nous évitons notre propre « Tour de Babel » : beaucoup d’ensembles de données mais peu ou pas de capacité pour les combiner ensemble dans les grands systèmes où réside la valeur réelle.

Plusieurs institutions publiques et organisations du monde entier développent des portails de données libres. Les portails Open Data facilitent l’accès et la réutilisation de l’information du secteur public. Il s’agit d’interfaces Web conçues pour faciliter la recherche d’informations réutilisables. Comme les catalogues de bibliothèque, ils contiennent des enregistrements de métadonnées des ensembles de données publiés pour réutilisation, c’est-à-dire principalement liés à des informations sous forme de données numériques brutes et non à des documents textuels. En combinaison avec des fonctionnalités de recherche spécifiques, ils facilitent la recherche d’ensembles de données d’intérêt. Les interfaces de programmation d’applications (IPA) sont également disponibles, offrant un accès direct et automatisé aux données pour les applications logicielles.

Les portails de données libres sont un élément important de la plupart des initiatives Open Data. Tout en soutenant cette politique, en offrant un accès facile aux données publiées, elles peuvent également fonctionner comme un catalyseur déclenchant la publication de données plus nombreuses et de meilleure qualité. Pour les administrations obligées ou désireuses de diffuser leurs données, elles offrent l’avantage de fournir un accès public sans avoir à répondre aux demandes individuelles d’accès aux données. Les portails de données libres sont principalement utilisés par les administrations publiques aux niveaux européen, national et local, car ils publient une grande variété de données. Mais de plus en plus d’entreprises ouvrent certaines de leurs données pour que les développeurs réutilisent.

Des exemples notables de portails Open Data gérés par les administrations publiques en Europe sont :

A tous les niveaux administratifs, le secteur public est l’un des principaux producteurs et détenteurs de données libres, qui va de cartes aux registres d’entreprises par exemple. Au cours des dernières années, le montant et la variété des données libres publiées par les administrations publiques à travers le monde ont connu une croissance tangible: le Recensement des données ouvertes par la Open Knowledge Foundation donne un aperçu de la quantité élevée de données publiquement disponibles.

De plus, une série d’indicateurs ont été sélectionnés pour mesurer la maturité des données libres en Europe. Ces indicateurs couvrent le niveau de développement des politiques nationales de promotion des données libres, l’évaluation des fonctionnalités mises à disposition sur les portails nationaux de données ainsi que l’impact attendu des données libres.

Plusieurs institutions, telles que l’Open Data Institute (ODI) et l’Open Knowledge Foundation (OKF), collaborent avec des entreprises et des gouvernements pour créer un écosystème de données ouvert et fiable, permettant de prendre de meilleures décisions en utilisant les données et en gérant leur imapct nuisible. Ils font également la promotion d’initiatives éducatives et de formation pour les citoyens (pour en savoir plus, voir la School of Data).

Arrière Prochain