CSV bestand omzetten naar generieke lijst
Home

CSV bestand omzetten naar generieke lijst

CSV bestand omzetten naar generieke lijst

Een csv (comma separated values) bestand inlezen en omzetten naar een generieke lijst van objecten.

Probleem

Gegevens kunnen manipuleren is iets wat elke programmeur moet kunnen. Het csv formaat is een algemeen bekend en gebruik formaat om gegevens van het ene naar het andere systeem over te brengen.

Als voorbeeld nemen we de postcodes van België. Je kan die gemakkelijk downloaden van de BPost website. We downloaden die Excel formaat. Zowel de Franse als de Nederlandse versie. We voegen beiden samen en exporteren het geheel als csv met het pipe '|' teken als scheidingsteken. We slaan dat op in een bestand met de naam Postcodes.csv en plaatsen dit in de map App_Data.

Hieronder zie je een uitreksel uit het Postcodes.csv bestand dat we op basis van de BPost Excel bestanden hebben gemaakt:

1495|VILLERS-LA-VILLE|Waals-Brabant|VILLERS-LA-VILLE|Brabant Wallon
1500|HALLE|Vlaams-Brabant|HALLE|Brabant Flamand
1501|Buizingen|Vlaams-Brabant|Buizingen|Brabant Flamand
1502|Lembeek|Vlaams-Brabant|Lembeek|Brabant Flamand
1540|Herfelingen|Vlaams-Brabant|Herfelingen|Brabant Flamand
1540|HERNE|Vlaams-Brabant|HERNE|Brabant Flamand
1541|Sint-Pieters-Kapelle|Vlaams-Brabant|Sint-Pieters-Kapelle|Brabant Flamand
1547|BEVER|Vlaams-Brabant|BIÉVÈNE|Brabant Flamand
1560|HOEILAART|Vlaams-Brabant|HOEILAART|Brabant Flamand
1570|GALMAARDEN|Vlaams-Brabant|GALMAARDEN|Brabant Flamand
1570|Tollembeek|Vlaams-Brabant|Tollembeek|Brabant Flamand
1570|Vollezele|Vlaams-Brabant|Vollezele|Brabant Flamand
1600|Oudenaken|Vlaams-Brabant|Oudenaken|Brabant Flamand
1600|Sint-Laureins-Berchem|Vlaams-Brabant|Sint-Laureins-Berchem|Brabant Flamand
1600|SINT-PIETERS-LEEUW|Vlaams-Brabant|SINT-PIETERS-LEEUW|Brabant Flamand

Elke regel in het CSV bestand stemt overeen met één rij uit een tabel (relationele databanken terminologie) of één entiteit (ERD terminoglogie). Het pipe '|' teken geeft de kolommen (terminologie relationele databanken) of de attributen (ERD terminologie) aan.

Design

We moeten dus eerst regel per regel de tekst doorlopen en daarna elke regel opslitsen in 5 kolommen. Als splitsingsteken gebruiken we het pipe '|' teken. Elke kolom waarde moeten we tenslotte toekennen aan de eigenschappen van de Postcode klasse. Vooraleer aan de volgende regel te beginnen stoppen we het pas gemaakte Postcode object in de generieke lijst.

Velden

naam bereik type omschrijving
code private string de postcode
plaats private string naam van de plaats in het Nederlands
provincie private string naam van de provincie in het Nederlands
localite private string naam van de plaats in het Frans
province private string naam van de provincie in het Frans

Eigenschappen

naam bereik type omschrijving
Code public string getter en setter voor code
Plaats public string getter en setter plaats
Provincie public string getter en setter voor provincie
Localite public string getter en setter voor localite
Province public string getter en setter voor province

Methoden

naam bereik type omschrijving
LeesUitCsvBestand public string retourneert de inhoud van het CSV bestand.
GetList public List retourneert een generieke lijst met Postcode objecten
ToObject public Postcode split een lijn in kolommen en stopt de waarden in een Postcode object en retourneert tenslotte het nieuw gemaakt object

Oplossing: Models/Postcode.cs

Vermits we de postcodes in de browser willen tonen, kunnen we die klasse als model gebruiken in MVC framework. We plaatsen dan ook de klasse in de namespace Model en het bestand in de map Models. In een productieapplicatie zou die in een Bll (Business Logic Layer) staan.

Let erop dat we in een Model klasse het bestand niet fysiek openen. Dat gebeurt in een andere laag, namelijk de DAL (data access layer). We respecteren hiermee het n-tier patroon.

using System.Collections.Generic;

namespace Model
{
    public class Postcode
    {
        private string code;

        public string Code
        {
            get { return code; }
            set { code = value; }
        }

        private string plaats;

        public string Plaats
        {
            get { return plaats; }
            set { plaats = value; }
        }

        private string provincie;

        public string Provincie
        {
            get { return provincie; }
            set { provincie = value; }
        }

        private string localite;

        public string Localite
        {
            get { return localite; }
            set { localite = value; }
        }

        private string province;

        public string Province
        {
            get { return province; }
            set { province = value; }
        }

        public string LeesUitCsvBestand()
        {
            Dal.Tekstbestand bestand = new Dal.Tekstbestand();
            // je zou voor de bestandsnaam eventueel ook een property kunnen gebruiken
            // zodat die hier niet hard coded staat
            bestand.FileName = @"C:\Programmeren 3\LerenWerkenMetMVC\App_Data\Postcodes.csv";
            bestand.Lees();
            return bestand.Text;
        }

        public List GetList()
        {

            string[] postcodes = this.LeesUitCsvBestand().Split('\n');
            List list = new List();
            foreach (string s in postcodes)
            {
                list.Add(this.ToObject(s));
            }
            return list;
        }

        public Postcode ToObject(string line)
        {
            Postcode postcode = new Postcode();
            string[] values = line.Split('|');
            postcode.code = values[0];
            postcode.Plaats = values[1];
            postcode.Provincie = values[2];
            postcode.Localite = values[3];
            postcode.Province = values[4];
            return postcode;
        }
    }
}
JI
2016-11-23 13:30:54