Methodik — Callejear Data Engine

Wie Callejear.be Straßendossiers erstellt: Quellen, Pipeline, Scoring, Rolle der KI und bekannte Grenzen.

1. Das Callejear Data Engine System

Callejear Data Engine ist das proprietäre System, das offizielle belgische Open Data mit einem eigenen Scoring-Modell und einer menschlich überwachten Narrative kombiniert. Es betreibt täglich vier europäische Märkte (ES, NL, FR, BE) und veröffentlicht insgesamt rund 1,4 Millionen Straßendossiers.

2. Quellen

QuelleInhaltLizenzFrequenz
BeSt AddressOffizielle Adress-GeolokalisierungCC0Monatlich
StatbelDemografie, Einkommen, statistische Sektoren, ImmobilienpreiseCC BY 2.0 BEJährlich
BCE-KBOAktive UnternehmenOpen Data BEWöchentlich
OpenStreetMapPOIs, Einrichtungen, ParksODbLMonatlich
GTFS (SNCB · STIB · De Lijn · TEC)ÖPNV-Haltestellen und FrequenzenOpen Data je BetreiberWöchentlich
IRCEL-CELINELuftqualitätOpen Data BEMonatlich

3. Pipeline in fünf Phasen

  1. Extraktion — Download offizieller Quellen über Python-Skripte.
  2. Normalisierung — Lambert 72 → WGS84, Namens-Deduplikation, Slug-Erzeugung.
  3. Kreuzung — Joins über NIS-Code + Postleitzahl + via_id.
  4. Scoring — Berechnung von urban_score und sechs Teil-Scores je Straße.
  5. Begleitete Narrative und Veröffentlichung — Regelbasierter Text je Straße, redaktionelle Prüfung für Gemeinde-Dossiers und Artikel.

4. Das Scoring-System

urban_score = 0.25·walkability + 0.20·commerce + 0.20·transport + 0.15·green + 0.10·noise_inv + 0.10·affordability

Jeder Teilscore liegt zwischen 0-100 und wird aus spezifischen OSM/GTFS/Statbel-Quellen berechnet. Walkability nutzt OSM-Einrichtungen innerhalb von 300 m; Transport nutzt GTFS-Haltestellen innerhalb von 500 m gewichtet nach Frequenz; Grün nutzt die Distanz zum nächsten Park ≥ 1 ha; Lärm nutzt regionale Lärmkarten; Affordability nutzt Statbel-Preise normalisiert je Gemeinde.

5. Die Rolle der KI

Wir erklären ausdrücklich: KI ist ein Werkzeug, kein Autor. KI hilft bei Anomalieerkennung, Sprachklassifikation und der Erstellung von Entwürfen, die der Redakteur überprüft. Redaktionelle Entscheidungen, Faktencheck und Quellenauswahl sind immer menschlich. Jeder Artikel unter /insights/ ist signiert, datiert und von Yoel Castaño Peón geprüft.

6. Anerkannte Grenzen

  • Quellen werden alle 3-6 Monate aktualisiert.
  • Unsere Scores sind keine Bewertungen einzelner Immobilien.
  • In sehr kleinen Gemeinden sind einige Daten unvollständig.
  • Die soziale Dimension eines Viertels wird nicht vollständig durch Scores erfasst.

7. Versionierung

Änderungen am Scoring-Modell werden im Changelog veröffentlicht. Aktuelle Version: v1.0 (2026-04).

Rechtlicher Hinweis. Die Informationen auf Callejear.be sind informativ und stellen keine auf Einzelfälle zugeschnittene finanzielle, rechtliche oder immobilienbezogene Beratung dar. Konsultieren Sie für Kauf-, Verkaufs- oder Investitionsentscheidungen eine qualifizierte Fachperson.