Fichiers CSV

February 25, 2015 in Data, Support by denisb

En entrée d’Undertracks, les données d’une étude peuvent être données sous la forme d’un fichier CSV. Le format CSV, ce n’est pas seulement donner “.csv” comme extension à son fichier, ou demander à son tableur préféré de le faire. C’est un format simple pour enregistrer des tableaux de données basé sur une organisation en 2 dimensions : ligne x colonne. Chaque ligne est indiquée par un saut de ligne (et les ennuis commencent : quel saut de ligne ? à la unix ? à la windows ? à la macos ? espérons que cela ne pose pas  de problème) Chaque colonne est délimitée par un caractère spécial, en principe la virgule (“comma”). D’autres délimiteurs sont possibles :  la tabulation, le “|”, le “;” et les caractères ascii non visibles N° 30 et 31 (plus difficile à obtenir, mais comme ils sont plus rares, ils sont aussi parfois plus pratique car n’interfèrent pas avec les données.   Ex.

Sexe,Prenom,Date
M,Alain,1912
F,Bea,1964
F,Bob,196

Parmi les points à prendre en compte pour avoir un bon fichier csv :

  • le codage : UTF8
  • le format de date : yyyy/mm/DD HH:MM:SS (de préférence)
  • un entête de colonne clair
  • pas de colonne vide
  • des colonnes bien remplies