dbsys.info

Hvilket format bør jeg velge?

De fleste datasettene er lagt ut både i form av SQL-skript og som (semikolonseparerte) CSV-filer. Skriptene oppretter alle tabellene i databasen og setter inn eksempeldata. CSV-filene inneholder eksempeldata for en enkelt tabell.

Både SQL-skript og CSV-filer er rene tekstfiler lagret med tegnsett UTF-8. SQL-skript er lagt ut i to varianter – både med og uten BOM. Velg med BOM for korrekt visning av norske tegn i nettleseren (altså hvis du har tenkt å klippe-og-lime fra nettleseren), men uten BOM hvis du skal laste ned filen. CSV-filer er lagt ut med tegnsett UTF-8 uten BOM.

CSV-filer Import og eksport av CSV-filer UTF-8 Byte-Order Mark (BOM)

UTF-8 og norske tegn

SQL-skript er som nevnt lagt ut på UTF-8 format – både med og uten BOM (Byte Order Mark). BOM kan skape problemer i noen SQL-verktøy, mens varianten uten BOM kan føre til at norske tegn ikke blir vist korrekt i nettleseren. Det er dermed valgt å legge ut begge varianter.

BOM er noen få spesielle byte satt inn helt i starten på en fil, som ulike verktøy/systemer kan avlese for å finne ut hvilket format/tegnsett filen har. En nettleser kan utnytte dette for å presentere norske tegn korrekt.

Nettleseren vil for øvrig vise norske tegn korrekt for begge varianter av UTF-8 hvis man eksplisitt endrer tegnsettet til UTF-8. I Firefox gjøres det fra meny Vis/View og valg Tegnkoding/Text Encoding. I andre nettlesere vil framgangsmåten være litt annerledes, prøv å søke etter "tegnsett" eller "encoding" og navn på nettleseren. Problemet med norske tegn oppstår bare hvis man klikker på lenken til SQL-skript i nettleseren. Hvis man derimot lagrer SQL-skriptet (høyreklikk og velg Lagre som), og deretter åpner filen i en editor, som f.eks. Sublime eller Notepad++, skal norske tegn bli vist korrekt enten man bruker formatet UTF-8 med eller uten BOM.

CSV-filer og Excel

CSV-filer er rene tekstfiler som kan brukes for å lagre en databasetabell på fil, f.eks. hvis man vil overføre data fra ett system til et annet. Mange av datasettene til boken er lagt ut (også) på dette formatet.

Merk spesielt at Excel kan lese CSV-filer direkte, og på Windows vil Excel typisk være definert som standard redigeringsprogram for CSV-filer. Det betyr at hvis man dobbeltklikker på en CSV-fil, vil filen bli åpnet i Excel. For å redigere i en editor, må man høyreklikke filen og velge "Åpne med".

Datoer i CSV-filer er lagret på MySQL-format ååå-mm-dd. Hvis man åpner og deretter lagrer en CSV-fil i Excel, kan datoformatet endres. Åpne CSV-filer i en editor som Sublime eller Notepad++ for å se hvordan data egentlig er ser ut.