CSV bestand omzetten naar generieke lijst
Probleem
Gegevens kunnen manipuleren is iets wat elke programmeur moet kunnen. Het csv formaat is een algemeen bekend en gebruik formaat om gegevens van het ene naar het andere systeem over te brengen.
Als voorbeeld nemen we de postcodes van België. Je kan die gemakkelijk downloaden van de BPost website. We downloaden die Excel formaat. Zowel de Franse als de Nederlandse versie. We voegen beiden samen en exporteren het geheel als csv met het pipe '|' teken als scheidingsteken. We slaan dat op in een bestand met de naam Postcodes.csv
en plaatsen dit in de map App_Data
.
Hieronder zie je een uitreksel uit het Postcodes.csv bestand dat we op basis van de BPost Excel bestanden hebben gemaakt:
1495|VILLERS-LA-VILLE|Waals-Brabant|VILLERS-LA-VILLE|Brabant Wallon 1500|HALLE|Vlaams-Brabant|HALLE|Brabant Flamand 1501|Buizingen|Vlaams-Brabant|Buizingen|Brabant Flamand 1502|Lembeek|Vlaams-Brabant|Lembeek|Brabant Flamand 1540|Herfelingen|Vlaams-Brabant|Herfelingen|Brabant Flamand 1540|HERNE|Vlaams-Brabant|HERNE|Brabant Flamand 1541|Sint-Pieters-Kapelle|Vlaams-Brabant|Sint-Pieters-Kapelle|Brabant Flamand 1547|BEVER|Vlaams-Brabant|BIÉVÈNE|Brabant Flamand 1560|HOEILAART|Vlaams-Brabant|HOEILAART|Brabant Flamand 1570|GALMAARDEN|Vlaams-Brabant|GALMAARDEN|Brabant Flamand 1570|Tollembeek|Vlaams-Brabant|Tollembeek|Brabant Flamand 1570|Vollezele|Vlaams-Brabant|Vollezele|Brabant Flamand 1600|Oudenaken|Vlaams-Brabant|Oudenaken|Brabant Flamand 1600|Sint-Laureins-Berchem|Vlaams-Brabant|Sint-Laureins-Berchem|Brabant Flamand 1600|SINT-PIETERS-LEEUW|Vlaams-Brabant|SINT-PIETERS-LEEUW|Brabant Flamand
Elke regel in het CSV bestand stemt overeen met één rij uit een tabel (relationele databanken terminologie) of één entiteit (ERD terminoglogie). Het pipe '|' teken geeft de kolommen (terminologie relationele databanken) of de attributen (ERD terminologie) aan.
Design
We moeten dus eerst regel per regel de tekst doorlopen en daarna elke regel opslitsen in 5 kolommen. Als splitsingsteken gebruiken we het pipe '|' teken. Elke kolom waarde moeten we tenslotte toekennen aan de eigenschappen van de Postcode
klasse. Vooraleer aan de volgende regel te beginnen stoppen we het pas gemaakte Postcode
object in de generieke lijst.
Velden
naam | bereik | type | omschrijving |
code | private | string | de postcode |
plaats | private | string | naam van de plaats in het Nederlands |
provincie | private | string | naam van de provincie in het Nederlands |
localite | private | string | naam van de plaats in het Frans |
province | private | string | naam van de provincie in het Frans |
Eigenschappen
naam | bereik | type | omschrijving |
Code | public | string | getter en setter voor code |
Plaats | public | string | getter en setter plaats |
Provincie | public | string | getter en setter voor provincie |
Localite | public | string | getter en setter voor localite |
Province | public | string | getter en setter voor province |
Methoden
naam | bereik | type | omschrijving |
LeesUitCsvBestand | public | string | retourneert de inhoud van het CSV bestand. |
GetList | public | List |
retourneert een generieke lijst met Postcode objecten |
ToObject | public | Postcode | split een lijn in kolommen en stopt de waarden in een Postcode object en retourneert tenslotte het nieuw gemaakt object |
Oplossing: Models/Postcode.cs
Vermits we de postcodes in de browser willen tonen, kunnen we die klasse als model gebruiken in MVC framework. We plaatsen dan ook de klasse in de namespace Model
en het bestand in de map Models
. In een productieapplicatie zou die in een Bll (Business Logic Layer) staan.
Let erop dat we in een Model klasse het bestand niet fysiek openen. Dat gebeurt in een andere laag, namelijk de DAL (data access layer). We respecteren hiermee het n-tier patroon.
using System.Collections.Generic; namespace Model { public class Postcode { private string code; public string Code { get { return code; } set { code = value; } } private string plaats; public string Plaats { get { return plaats; } set { plaats = value; } } private string provincie; public string Provincie { get { return provincie; } set { provincie = value; } } private string localite; public string Localite { get { return localite; } set { localite = value; } } private string province; public string Province { get { return province; } set { province = value; } } public string LeesUitCsvBestand() { Dal.Tekstbestand bestand = new Dal.Tekstbestand(); // je zou voor de bestandsnaam eventueel ook een property kunnen gebruiken // zodat die hier niet hard coded staat bestand.FileName = @"C:\Programmeren 3\LerenWerkenMetMVC\App_Data\Postcodes.csv"; bestand.Lees(); return bestand.Text; } public ListGetList() { string[] postcodes = this.LeesUitCsvBestand().Split('\n'); List list = new List (); foreach (string s in postcodes) { list.Add(this.ToObject(s)); } return list; } public Postcode ToObject(string line) { Postcode postcode = new Postcode(); string[] values = line.Split('|'); postcode.code = values[0]; postcode.Plaats = values[1]; postcode.Provincie = values[2]; postcode.Localite = values[3]; postcode.Province = values[4]; return postcode; } } }