minibb®  
 | Forums | Sign Up | Reply | Search | Statistics |
6PP algemeen 6PP forum / 6PP algemeen /

Nog 33396 extra postcodes

 
Skinkie
Forums Member
#1 | Posted: 2 Apr 2010 18:58 | Edited by: Skinkie
Reply 
Ik zie dat Kees nog steeds niet de postcodes heeft ingevoerd die ik uit openkvk had gevist. Dat levert nog eens 33396 extra postcodes op, lijkt me 'mooi meegenomen'.

Daarbij heb ik net de CVS exports even nagelopen en zitten er een aantal rijen met " in, die klopten toevallig allemaal niet.

http://api.openkvk.nl/postcodes-voor-6pp.txt

Is het hele bestand met 76k aan records waarvan er dus 33k unieke postcodes zijn. En als je zelf zaken als 'hoog en laag' er niet wilt gaan uithalen met regular expressions... heb ik ook nog een bestandje gemaakt die direct geinsert kan worden...

http://api.openkvk.nl/postcodes-voor-6pp-filter.txt
Skinkie
Forums Member
#2 | Posted: 4 Apr 2010 18:36
Reply 
Net naar het upload script gekeken, was niet vanplan een paar honderd keer op 'al het geselecteerde toevoegen' te gaan klikken.

Wat ik toevallig nog wel vond is een ontbrekende 4PP;
8490,Akkrum
kvdb
Admin
#3 | Posted: 6 Apr 2010 09:37
Reply 
Hee skinkie, mooie toevoegingen. Wil ik ook graag gebruiken.
Zie nog wel enkele encoding probleempjes zoals: Exloërmond
Kan aan mijn browser liggen?

Er is flinke interesse in Pro6PP, dus daar ben ik even druk mee. Zodra dat op de rit staat probeer ik weer een slag te maken in 6PP. Er liggen nog meer CSV's te wachten op import...

Eerlijk is eerlijk. Ben dat een beetje aan het afhouden, de reden is als volgt: ik wil de backend nog wat aanpassen zodat edits elkaar niet meer overschrijven maar dat ik nog strakker kan bijhouden waar data vandaan komt en van wie de edits afkomstig zijn op een later tijdstip.
Skinkie
Forums Member
#4 | Posted: 6 Apr 2010 19:44
Reply 
De encoding die jij aangeeft is UTF8, als je zelf ISO-8859-1 doet moet je even iconv doen. Ik begrijp je motivatie, maar ik vind het een beetje vreemd dat je nu net doet of de data niet beschikbaar is en je maar 50% van de data hebt, terwijl we misschien al boven 75% zitten.
kvdb
Admin
#5 | Posted: 7 Apr 2010 08:25
Reply 
Hoe is jouw rekenmethode?
Guest
#6 | Posted: 23 Apr 2010 18:07
Reply 
Ik heb dit bestand opgeschoond, ontdubbeld en van juiste opmaak voorzien.

In totaal kom ik op 33.313 straten die nog niet in 6pp te vinden zijn. Ik hiervan een mysql tabel die zo ge-insert kan worden.

Ik kom nog wel een aantal postcodes tegen die zeer veel straten bevaten. Deze zijn:
1117AA
1118AA
2020NA

Deze drie zijn niet terug te vinden op postcode.nl. Dit doet mij vermoeden dat deze postcodes incorrect zijn.

Indien gewenst kan ik het geschoonde bestand opsturen.
kvdb
Admin
#7 | Posted: 23 Apr 2010 18:17
Reply 
Stuur maar op, ben benieuwd!

Kan je me zo vertellen hoe ik iconv moet gebruiken voor dit bestand?

Groet,
Kees
Guest
#8 | Posted: 23 Apr 2010 19:01
Reply 
iconv zou ik niet gebruiken...

Ik heb een functie in PHP geschreven die straatnamen omzet. Hierbij worden de meest gebruikte afkortingen volledig gemaakt en bijvoorbeeld lidwoorden en tussenvoegsels klein gehouden. Spaties tussen initialen en meerletterige initialen worden verwijderd en nog wat opschoningen.

Ik heb hiermee heel wat dubbelen gevonden in de huidige 6pp die inmiddels allemaal verwijderd zijn.

Om een voorbeeld te noemen:
Mr H. B. abcstr
wordt omgezet naar:
Meester H.B. Abcstraat

Wat mij betreft mag je die ook hebben om te gebruiken.

Waar kan ik dit naar toe sturen?
Guest
#9 | Posted: 23 Apr 2010 19:41
Reply 
Sorry, begreep je niet helemaal goed. Wat de encoding betreft. Het is al allemaal UTF-8. Je browser staat waarschijnlijk standaard op ISO-8859-1.

De tabel die ik heb gemaakt heeft net als 6pp de UTF-8 encoding. Ik heb zo snel geen voorbeeld gevonden, maar volgens mij is hij helemaal goed. Omdat Exloërmond een plaatsnaam is heb ik die niet meegenomen in de tabel. Alle 4-cijferige postcodes komen al voor in 6pp.
kvdb
Admin
#10 | Posted: 23 Apr 2010 19:44
Reply 
Ah, ik dacht dat je de originele poster van deze thread was (Skinkie), vandaar mijn vraag over iconv. kvdb@kvdb.net is het adres.
Guest
#11 | Posted: 23 Apr 2010 19:59
Reply 
Zit in je mailbox.
W1lz0r
Forums Member
#12 | Posted: 10 May 2010 00:27
Reply 
Ik heb ze inmiddels toegevoegd via de API. Ze zitten er dus in.
 
Your Reply
Bold Style  Italic Style  Image Link  URL Link  Preformatted Text 

To prove that you are a human rather than spambot, please answer the following question:
How much is two plus two?
» Username  » Password 
Only registered users are allowed to post here. Please enter your login/password details upon posting a message, or sign up first.
 

Forums are powered by miniBB®