class: center, middle, inverse, title-slide # Počítání pražských putyk ## případová studie na GIS v erku ### Jindra Lacko ###
22.5.2019 @ Etnetera --- # Agenda -- ## Optimizace distribuční sítě – bary v Praze (záminka) -- ## Představení GIS práce v erku (vážná věc) -- ### ✔️️ Bodová data (souřadnice) -- ### ✔️️ Data za administrativní oblasti (polygony) -- ### ✔️️ Rasterová data (snímky ze satelitu) -- ## Statistická analýza nad prostorovými daty --- # Cílem optimalizace bude -- ## *Najít* matematický model, který vyjadřuje závislost -- ## *Uplatnit* nalezený model, a ukázat odchylky -- ## Z nalezených odchylek *identifikovat*: -- ### ✔ příliš řidká místa (kandidáty na zahuštění) -- ### ✔ příliš hustá místa (kandidáty na pročištění) --- # Použitá data -- ### Dataset 1 171 pražských barů (jméno a souřadnice) -- ### Populace po městských částech – [otevřená data ČSÚ](https://www.czso.cz/csu/czso/otevrena_data) -- ### Hotelová lůžka po městských částech – [otevřená data ČSÚ](https://www.czso.cz/csu/czso/otevrena_data) -- ### Souřadnice stanic metra – [Open Data hl. m. Prahy](http://opendata.praha.eu/dataset/ipr-prazska_integrovana_doprava_-_vstupy_do_metra) -- ### Satelitní snímkování – [Copernicus / Sentinel](http://copernicus.gov.cz/pristup-k-datum) za 30. červen 2018 --- # Společný jmenovatel – mřížka (grid) -- <img src="prezka_files/figure-html/grid-1.png" width="85%" style="display: block; margin: auto auto auto 0;" /> --- # Přehled barů – body -- <img src="prezka_files/figure-html/bary-body-1.png" width="85%" style="display: block; margin: auto auto auto 0;" /> --- # Přehled barů – grid -- <img src="prezka_files/figure-html/bary-grid-1.png" width="85%" style="display: block; margin: auto auto auto 0;" /> --- # Přehled populace – části -- <img src="prezka_files/figure-html/pop-casti-1.png" width="85%" style="display: block; margin: auto auto auto 0;" /> --- # Přehled populace – grid -- <img src="prezka_files/figure-html/pop-grid-1.png" width="85%" style="display: block; margin: auto auto auto 0;" /> --- # Přehled hotelových lůžek – části -- <img src="prezka_files/figure-html/beds-casti-1.png" width="85%" style="display: block; margin: auto auto auto 0;" /> --- # Přehled hotelových lůžek – grid -- <img src="prezka_files/figure-html/beds-grid-1.png" width="85%" style="display: block; margin: auto auto auto 0;" /> --- # Přehled stanic metra – body -- <img src="prezka_files/figure-html/metro-body-1.png" width="85%" style="display: block; margin: auto auto auto 0;" /> --- # Přehled stanic metra – grid -- <img src="prezka_files/figure-html/metro-grid-1.png" width="85%" style="display: block; margin: auto auto auto 0;" /> --- # Kvalita vegetace – raster -- <img src="prezka_files/figure-html/ndvi-raster-1.png" width="85%" style="display: block; margin: auto auto auto 0;" /> --- # Kvalita vegetace – grid -- <img src="prezka_files/figure-html/ndvi-grid-1.png" width="85%" style="display: block; margin: auto auto auto 0;" /> --- # Baseline – 1 proměnná -- ``` ## ## Call: ## lm(formula = barcount ~ pop, data = grid) ## ## Residuals: ## Min 1Q Median 3Q Max ## -16.273 -2.822 0.131 1.136 41.331 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) -1.416e+00 4.399e-01 -3.219 0.0014 ** ## pop 1.339e-03 8.964e-05 14.936 <2e-16 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 6.088 on 369 degrees of freedom ## Multiple R-squared: 0.3768, Adjusted R-squared: 0.3751 ## F-statistic: 223.1 on 1 and 369 DF, p-value: < 2.2e-16 ``` -- Na uživení hospody je potřeba: 747 místňáků v okolí 5 kilometrů čtverečných. --- # Jednoduchý model – 4 proměnné -- ``` ## ## Call: ## lm(formula = barcount ~ pop + beds + stations + vegetation, data = grid) ## ## Residuals: ## Min 1Q Median 3Q Max ## -14.110 -1.542 -0.277 1.070 36.380 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) 3.610e+00 1.113e+00 3.243 0.00129 ** ## pop 6.154e-04 7.645e-05 8.049 1.18e-14 *** ## beds 2.752e-03 1.988e-04 13.843 < 2e-16 *** ## stations 2.528e+00 6.218e-01 4.066 5.86e-05 *** ## vegetation -8.688e+00 2.200e+00 -3.950 9.38e-05 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 4.343 on 366 degrees of freedom ## Multiple R-squared: 0.6855, Adjusted R-squared: 0.682 ## F-statistic: 199.4 on 4 and 366 DF, p-value: < 2.2e-16 ``` -- Na uživení hospody je potřeba: buď 1 625 místňáků, nebo 363 hotelových lůžek, v okolí 5 kilometrů čtverečných. --- # Složitější model – 4 + 2 proměnné -- ``` ## ## Call: ## lm(formula = barcount ~ pop + beds + stations + vegetation + ## pop_times_veg + bed_times_veg, data = grid) ## ## Residuals: ## Min 1Q Median 3Q Max ## -14.671 -0.968 -0.327 0.631 34.765 ## ## Coefficients: ## Estimate Std. Error t value Pr(>|t|) ## (Intercept) -1.6337359 1.1562081 -1.413 0.15851 ## pop 0.0031626 0.0002827 11.187 < 2e-16 *** ## beds 0.0012058 0.0004246 2.840 0.00476 ** ## stations 1.6079738 0.5977655 2.690 0.00747 ** ## vegetation 3.8121258 2.4045999 1.585 0.11376 ## pop_times_veg -0.0060931 0.0006573 -9.270 < 2e-16 *** ## bed_times_veg 0.0032953 0.0014310 2.303 0.02185 * ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 3.915 on 364 degrees of freedom ## Multiple R-squared: 0.7458, Adjusted R-squared: 0.7416 ## F-statistic: 178 on 6 and 364 DF, p-value: < 2.2e-16 ``` --- # Alternativa – 4 proměnné (Poisson) -- ``` ## ## Call: ## glm(formula = barcount ~ pop + beds + stations + vegetation, ## family = "poisson", data = grid) ## ## Deviance Residuals: ## Min 1Q Median 3Q Max ## -6.5109 -1.5258 -1.0600 0.2617 10.3633 ## ## Coefficients: ## Estimate Std. Error z value Pr(>|z|) ## (Intercept) 1.974e+00 1.777e-01 11.111 < 2e-16 *** ## pop 1.691e-04 5.991e-06 28.222 < 2e-16 *** ## beds 6.653e-05 1.273e-05 5.227 1.73e-07 *** ## stations 3.005e-02 4.575e-02 0.657 0.511 ## vegetation -4.535e+00 3.894e-01 -11.647 < 2e-16 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## (Dispersion parameter for poisson family taken to be 1) ## ## Null deviance: 3380.5 on 370 degrees of freedom ## Residual deviance: 1227.0 on 366 degrees of freedom ## AIC: 1787.2 ## ## Number of Fisher Scoring iterations: 6 ``` --- # Histogram reziduálů přes modely -- <img src="prezka_files/figure-html/resid-plot-1.png" width="85%" style="display: block; margin: auto auto auto 0;" /> --- # Závěrečná prezentace – rezidua v mapě
--- class: inverse, middle, center # Děkuji za pozornost -- <br> ## Prezentace – včetně dat a kódu – je na GitHubu ## [https://github.com/jlacko/hospody-gis](https://github.com/jlacko/hospody-gis) -- <br><br> Jindra Lacko [jindra@jla-data.net](mailto:jindra@jla-data.net) [www.jla-data.net](http://www.jla-data.net)