Jak temperatura wpływa na natężenie ruchu w Warszawie?

Zimno, ciepło… ale czy tłoczno? Dowiedz się w jaki sposób sprawdziliśmy wpływ temperatury na natężenie ruchu w 5 popularnych lokalizacjach Warszawy.

Jedną z wielu możliwości wykorzystania danych lokalizacyjnych jest analiza trendów przepływu ruchu. Zdecydowaliśmy się na badanie ruchu w zależności od temperatury – pogoda to bardzo wdzięczny temat w każdej sytuacji!

Krok 1: Wybranie zasięgów analizy

Do badania wybraliśmy 5 rozpoznawalnych miejsc w Warszawie. Ciemne kółka obrazują dokładne obszary brane pod lupę przez naszego analityka. Ich średnica to 200-400 metrów w zależności od lokalizacji.

zasiegi-1

Krok 2: Gromadzenie danych

Przygotowanie analizy wymagało połączenia dwóch zbiorów danych.

DANE MOBILNE + DANE O POGODZIE

zbiory_2-1

Dane o ruchu (mobilne) są to duże zbiory danych, które zawierają informacje o pojawieniu się urządzeń mobilnych w zasięgu routera wifi.
Urządzenia mobilne, próbując znaleźć „znajome” routery wysyłają zapytania o przyłączenie się do okolicznych sieci. Urządzenia sieciowe agregują tego typu zapytania, razem z informacją o unikalnym ID urządzenia, lokalizacją i czasie, kiedy próba połączenia nastąpiła.
Są to jedyne informacje, które nasze urządzenie przekazuje, dzięki czemu tego typu dane są zupełnie anonimowe i nie umożliwiają identyfikacji właściciela urządzenia, ale w większej skali pozwalają na analizę trendów ruchu.

Dane o warunkach pogodowych są danymi historycznymi możliwymi do uzyskania poprzez API (interfejs, który pozwala dwóm aplikacjom komunikować się miedzy sobą) udostępniany przez firmy będące w posiadaniu historycznych zbiorów danych pogodowych w wybranej lokalizacji.

Krok 3: Agregacja oraz analiza danych

  • Dane mobilne w stanie surowym są trudne w analizie, ponieważ sygnały wysyłane są w nieregularnych odstępach czasu od kilku urządzeń wifi jednocześnie, przez co mamy do czynienia ze znaczącym ich zaszumieniem. W celu doprowadzenia danych do formy, w której będą mogły być analizowane, muszą przejść przez wielostopniowy proces przetworzenia. Począwszy od przetworzenia adresów MAC wifi i siły sygnału na lokalizację użytkownika, przez normalizację danych do regularnych szeregów czasowych i na końcu powiązanie ruchu użytkownika ze znaną nam siatką dróg i budynków. Ponieważ to podstawa naszej działalności, w placeme opracowaliśmy silniki geoanalityczne, które przeprowadzają ten proces automatycznie.
    …..
  • Po selekcji określiliśmy stopień agregacji sygnałów – na potrzeby tej analizy zdecydowaliśmy się na wyliczenie wystąpień unikalnych urządzeń w regularnych zakresach czasowych (jedna godzina).
    ….
  • Należy tu zaznaczyć, że dane mobilne nie reprezentują pełnej populacji ludzi przebywających na danym obszarze (nie wszyscy korzystają z telefonów komórkowych , trudno jest uzyskać sygnały mobilne ze wszystkich urządzeń wifi w danej okolicy). Dlatego do oszacowania pełnej populacji stosujemy autorski model uczenia maszynowego, który porównuje charakterystykę lokalizacji i liczbę obserwowanych urządzeń ze zbiorem miejsc, gdzie jesteśmy pewni natężenia ruchu dzięki manualnym obserwacjom. Jest on w stanie wyekstrapolować wynik, biorąc pod uwagę szereg ważnych czynników jak np. to, że na terenach wiejskich liczba telefonów na człowieka jest mniejsza niż w dużych miastach.
    ….
  • Oprócz zbioru danych mobilnych przeprowadziliśmy obróbkę danych pogodowych. Zbiór ten zawiera informacje o warunkach atmosferycznych (tj. temperatura, ilość opadów, prędkość wiatru) w pięciominutowych odstępach czasowych. Podobnie jak w przypadku danych mobilnych przeprowadzono selekcję danych, w celu ustalenia wspólnych zakresów czasowych,  np. poprzez uśrednienie pomiarów w przeciągu jednej godziny.

Krok 4: Wizualizacja wyników

Gdy mamy gotowe oba zbiory (natężenie ruchu i warunki pogodowe w przedziale godzinowym) możemy je połączyć w jeden zestaw danych. Tak przygotowany zbiór umożliwia wizualizację wyników. Na tym etapie najtrudniejsze jest wybranie takiej formy wizualizacji, która będzie najbardziej czytelna i zrozumiała. W placeme do szybkiego prototypowania wizualizacji najchętniej używamy Tableau, a kiedy znajdziemy format który nam odpowiada, tworzymy odpowiednią logikę w Pythonie.

pogoda-2

A poniżej dużo przyjemniejsza dla oka wizualizacja wykresu, w postaci krótkiego filmiku.
Czy coś Was zaskakuje?

Już teraz sprawdź, jak działa Placeme.
Załóż darmowe konto.

Skontaktuj się z nami

lub Zarejestruj się