<menu id="imege"></menu>
  • <menu id="imege"><tt id="imege"></tt></menu>
  • <input id="imege"><menu id="imege"></menu></input>
  • <input id="imege"><tt id="imege"></tt></input>
    <nav id="imege"><strong id="imege"></strong></nav>
    <xmp id="imege"><center id="imege"></center>
  • <xmp id="imege"><menu id="imege"></menu>

    郭繼孚:交通大數據分析亟待規范——從指數亂象談起

    人已閱讀 - - 作者: 郭繼孚 0

    各種針對城市運行的專業研判,走到了新的數據環境之下。大數據交通指數就是一例。這意味著什么?公眾和專業人士,又應該如何看待各種互聯網公司對城市進行的排名?A9T行之道

    本文來自北京交通發展研究院院長、教授級高級工程師郭繼孚在第11屆中國智能交通大會上的演講。可以給我們很好的啟發。A9T行之道

    前面幾位專家談了很多交通大數據應用問題,我談一個不大不小的問題,指數亂象。哪里亂呢?先說個具體的例子。A9T行之道

    這個指數(下圖)大家在網上看到很多回了。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8rYOpebcUmaiapzsibylGJNKc168jlEcLR4r2kxHEkTVzibHpf3w7Q7kYg/640?wx_fmt=jpeg

    A9T行之道

    具體是哪些公司的,我就不直說了。尤其是,有些數據的結果不怎么樣,也不好指名道姓。A9T行之道

    亂在哪里呢?這(上圖)說的是同一個時間、同一個城市的擁堵情況排名,但兩個公司的結果不一樣。大家要知道,他們號稱的算法是一樣的。但最后結果不一樣。為什么呢?A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8ylE2zyAw12P08HoIULULppYpq0sLLmalSnYPFfd6pCPEzGatSE0mtw/640?wx_fmt=jpeg
    (上圖)是另一個排名,它們的差距是挺大的。
    A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8omnCzA3VXB7DAITx91xJF6CgBVMNtmt1lbsrLYs6sW3PiaV3a8pwrzQ/0?
    (上圖)是一個國外公司的排名,看前12位,跟我們的排名的結果差距挺大的。這基本上都是互聯網公司做的結果。
    A9T行之道

    我們還有很多專業的研究報告,包括北京在內,也是五花八門(下圖)A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8VicH6dRpITH1c32BicQJRL8RSFicTEhESiatwU8U7yUibWIhPMEic1TicuxkA/0? A9T行之道

    就連用指數表征的擁堵范圍,都不一致。在北京,指數是0到10,上海是0到100。還有0到5的,以及不知道到多少的。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8Z5QJQ7EgFbKSFn35SJ8bA3mE2Ek8iakH0TECDnv2awvrllOSDGuIyYA/0?
    A9T行之道

    如果公眾看到,在北京擁堵指數是這樣,到了上海卻是那樣的,一定感到無所適從。最主要的問題是,這指數范圍不同,只是為了不同而不同。我們當時研究了一下,從0到10有一定的道理,而其他人就講,從0到5有道理。但本質上并沒有什么不同,是為了不同而不同,所以造成了大家的困惑。A9T行之道

    另外,這些分析的結論也完全不一樣。這都是大數據:一個說擁堵加劇,一個說速度上升,意味著擁堵緩解。說的是同一個事情。所以,我們不要過度盲目崇拜大數據。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8HeNCz7Ks1iatfuiaULTBSfnHUQKCrmBWtNQVy9gibUcMb3sSBSPWRm8zA/0? A9T行之道

    其實非常簡單,他們的分析,連時段都不一樣。這個分析2小時,那個分析3小時,所以結果不一樣(下圖)A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8dNicOUVcgHR1ZzIStgWIYbIIP8DUVibwhiccrmaV06XibWjV7qMPR1ZOsQ/0? A9T行之道

    這個是號稱大數據說話:專車沒有導致交通擁堵(下圖)。大家可以搜一下,就這么一個結論,在互聯網上傳播量非常大。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8pialq8Ynfv7CwiamSqMISic3ztwvRRZIk7k3WYWWGc0p21GWyjVM4Q7Kw/0? A9T行之道

    灰色線,是專車的數量增加了;黃色線是速度,它說沒有變化,沒有導致擁堵。但我看,它確實是有變化,而且變化很滑稽:這是在北京,在7月份的時候,速度居然是降低的!A9T行之道

    看看我們的數據(下圖)A9T行之道

    640.jpg
    A9T行之道

    這不是要吹噓我們的數據多準。只是想要說明一個狀況——這個狀況不止在北京,全國交通系統都如此:一年12個月,每個月的交通狀況是有變化規律的,最低點在2月份,因為過春節,次低點是在7、8月份,這是因為學校放假了,交通就好走了。9月份最堵,是因為剛開學,大家都要送孩子上學,連高中都送,送一個月就好了,再加上過中秋節,送月餅。這些特征大家都知道。A9T行之道

    可是那個數據結果是反的。我都不知道那個數據是怎么出來的。A9T行之道

    這是剛出現的一個報告(下圖)A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx84VE1tXLwVmskgXoA3ZbH7QTUa9J3gAJkQ3cLFgSLw2V6pmujiaEucpw/0?A9T行之道

    看這個數據,還是說北京,白線是速度。得出的結論還是,網約車的數量增加了那么多,但速度沒變,說明速度和滴滴的訂單量無關。潛臺詞是,北京的交通擁堵跟網約車沒有關系。A9T行之道

    我想跟大家講的是,這超出了常理。什么是網約車?網約車不就是出租車嗎?網約車不就是坐在汽車里把你運到目的地,難道不占用道路流量嗎?如果你原來是開車的,現在不開車,改坐網約車了,他們就說不堵了,但你不還是坐在小汽車上到達目的地了?有人原來是坐公共交通的,發現網約車這么便宜,那么打車吧,這種人肯定是有的。所以,會不堵嗎?A9T行之道



    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8P3SEBb7vVJ2vbYeIk9EGqWlQVW1zWZsGMO1MOdolEa32CM4icWyhBLQ/0?A9T行之道

    我們的數據結果是,2015年全國的城市中,北京最先發現擁堵指數上升了20%。廣州、深圳等地,有指數的地方,都發現了這個問題。結果,上面的大數據報告,告訴我沒有這回事。這么唬人的結果都是大數據的結果。為什么呢?
    A9T行之道

    我猜,是因為這些互聯網公司,不知道這些常理。因為,用專業的判斷和結論,就知道那些大數據研究是對還是錯。大家一定不要喪失自己最基本的判斷。A9T行之道

    你如果仔細注意,就會發現,(上圖是)把北京市域總行程速度與滴滴訂單量比較,要是拿全國路網速度的數據去跟北京比較,那完全對不上關系。我們說的擁堵,說的是北京市中心的擁堵,郊區不堵。把郊區的數據與市中心的數據放在一起,就出現了問題。就這么簡單的道理。但這種簡單的錯誤,導致非常滑稽的結果。這就是我們的亂象。A9T行之道

    從科學的角度,這種亂象是不應該出現的。我們不能把等級統一一下,不能把數值歸集到一起嗎?是可以的。需要大家坐下來研究,而不要為了不同而不同。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx85XbCKoa75LxkUt6Bdz4hfJ3vIlNc69PZupxEJJYjgsicbVqjDjeYybQ/0?
    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8bCymABnDFDgIms9ljXZMgFpbrPhvwBeZBlSaFvKljxVq7P0zS0B5og/0?
    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8SOFOB5p2dZ3ceXJcxHEAbbxGpDyutXS5PsuMUpVBUGQjLE3ROKtRdg/0?
    A9T行之道

    這背后還是存在一些科學問題。我不相信,大數據來了以后,就能告訴你一切。這還是需要一些方法的。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8mt8xV8mBNViapXibvUELTaaliahn0BJGWSEMjfTcMQOCcIdVq3vk0SNNw/0?
    A9T行之道

    拿擁堵本身來說,有各種各樣的算法。我們用這些算法對北京都做過。為什么我們要堅持用擁堵比例來反映擁堵?非常淺顯的道理,看(上圖)右下角這個圖,一邊堵一邊不堵,你的感覺是什么?如果我們用平均值來計算,這種擁堵就會被嚴重弱化。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8E24A2dMeQ8qEV2t8OhMMpgp0a0JWI7srCCRgOYzbHr5HkxHB6PwXWQ/0? A9T行之道

    實際上,無論你在哪邊走,都會和別人說北京真堵。A9T行之道

    人們會放大自己感受強烈的這部分。這在傳播學上也有依據。這就是我們推薦這個方法的原因。而且我們經過了社會調查,發現這個方法和社會調查的結果一致。A9T行之道

    通過這個小現象,大家可以強化一下、思考一下交通的大數據到底應該怎么用。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx89IkvzyKZtTqIEcFqUpIiar9h8Q67kD5TCLnkD55uf6icxQ2CbIzDB3mg/0? A9T行之道

    傳統的浮動車數據更能說明問題A9T行之道

    我們北京交通發展研究院,2005年開始采用浮動車數據。 A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8NHcYs7h0VKicKAvShgsDEvBlGXYT7icRwlDr36kfzKqD8NfmceCNiaySQ/0?
    我們發現,這背后有很多事情,需要扎扎實實去做。


    比如,采樣頻率。出租車公司的數據是不同頻率的。隔五分鐘采集一次,跟一秒鐘采集一次的結果是不一樣的。要進行分析。

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8GicjScYl9uicUZxYsDwpXJ87vnbMibjA7sz4gj4VDqtjC7YqJ2s3DwM0g/0?
    A9T行之道

    到底有多少車的時候,才能讓數據得到一個可靠的結果,又在什么情況下有怎樣的置信度。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8G3NJVt3GiaPhlRUSymH4AdibrjTU405ibBUHFMCYDLibVKUlIZRMYnBFjA/0? A9T行之道

    比如說,這個樣本的代表性到底行不行。我們當時在做這個實驗的時候,鬧過一次笑話。因為此前都沒有數據,有了浮動車之后,能讓領導看到實時信息,領導看到之后,就直接從辦公室選了一條路線回家,結果發現,這是最堵的一條。A9T行之道

    為什么會發生這樣的情況?因為那時浮動車比較少,被選中的這條路上沒有出租車,沒有信息,就顯示成了暢通的一條路。實際上那條路很堵,出租車司機都知道。如果數據代表性不夠,就會發生這樣的結果。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8C6IdqCBs5OIFq3zpTxM1we87bqbzE6sq3wqzNou3m8iaIatSDHgsJuA/0? A9T行之道

    再一個,很多城市的出租車跟正常的駕駛不一樣,可以繞著紅綠燈過馬路。這樣的結果,可以反映小汽車的交通嗎?不能。不能直接拿來就用。車牌識別的數據,也不能直接拿過來就用,因為我們不知道車輛在兩個攝像頭之間做了什么,其實是可以用的,但一定要深入分析,看看有沒有代表性。A9T行之道


    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8bKjwvlgv50tibGB5dBpndTKI1hyxCxsw8thKCN4SK4QGqrdGCk0M6Zw/0?
    A9T行之道


    A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx80HNO5wCPcrsq1kkcEk3eV1oy9LVXjoHuH66P4mKoOWL36ZtjicWyQicQ/0? A9T行之道

    當然,還有很多技術細節,需要認認真真地考慮。最后,經過數據清洗以后,才能得到一個比較可靠的數據。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8eVhG28ADLYIDlDzBhfiaVsFCTSnC8GJnFtGeM6dibGNAXoIian1ag4hYg/0? A9T行之道

    另外,我們做出的結果,是干什么用呢?我們要為用而想,我們在做交通指數設計的時候,是要把一天24小時的交通特征反映出來,讓決策者和市民能夠感受到真正的擁堵水平。讓大家看到這個交通指數,就知道交通狀況是什么樣。北京用這個數來定工作目標,年度這個值必須控制在一個位置——如果這個數據沒有說服力,區長就會來找我。因此,這個數據要足夠敏感。北京一到尾號4、9限行的時候就會堵,因為尾號4的車比較少,原先老百姓不知道,為什么每隔幾天就會堵,后來我們發現這是尾號限行鬧的。這些數據的結果,要與一些宏觀的感受一致。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8uEd8Rkz2o2ZCJy5dEAGObiaiciaQ4XfQWbIHo6ichmaeQpySXmNATz37Tg/0?A9T行之道

    北京連續這么多年,不斷和擁堵做抗爭,不斷起起落落,每一步措施與交通特征都是對應的,我們可以找到關系。A9T行之道

    奧運會的時候,北京交通暢通。我們的結果要能反映出這樣的特征。如果反映不出來這樣的特征,全天都是暢通的。有什么意義呢?A9T行之道

    另外一個精細的結果如下。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8fUOVoTQAHvrvyWOC026oVw2XrH7kT9Cxmic5uXYh54Xa0B80YlLiaM4Q/0?A9T行之道

    2011年整體的交通擁堵指數,年前還是漲了,過了年降下來了。到4月份又下來,是因為,我們路邊停車費從2塊錢提高到10塊錢,但兩個月后作用喪失了。我們不敢相信這樣的數據結果,要到現場去做調查,為什么停車新政持續了兩個月以后,指數又反轉了。我們發現,原因是收費的停車場空著,旁邊可以亂停了,執法沒跟上,影響了政策的效果。
    另一個政策措施的關聯驗證如下。A9T行之道


    A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8mY5o2qs1pNOVbTGboMvIoIRuagz0bibP4QDk7qaqlpOTA9LPFR1G8bQ/0?
    A9T行之道

    2012年底國家實施八項規定后,節前晚高峰交通擁堵情況有所緩解。2013年春節、中秋節、國慶節前晚高峰交通指數分別同比下降12.8%、4.0%、19.8%A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8D4kJspKSZMHMaf6kp89AxOWzCYBwljDgvfMwsbvIPdHicm0ul4SztHg/0?

    A9T行之道

    公交IC卡的數據也不是拿來就可以用的。有上車沒有下的信息,不同POS機的時間點都不一樣,需要一系列的過濾清洗,補充信息。特別是需要經過交叉驗證。
    大家現在對信令數據比較癡迷。 A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8W0fwnqpj9pIkqgVUyf3sxXkjc4ffUQyrsAak7OlnUNH5JqIxy0Xdrw/0?
    A9T行之道

    但信令數據就能告訴我們一切嗎?其實也不是的。信令數據的結果和我們真正的交通調查結果還是有一定偏差的。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8pCEGRWEy6nJVulAQgbK9DPBfncB6o29BBD4cAuhicfXKzDbpRdc12sA/0?


    A9T行之道

    再和大家介紹一個和道路交通應用關聯的新數據:智駕數據。A9T行之道

    這是個OBD終端,裝在車上,每一輛車每一刻的數據都返回來。點火時間、結束時間等等數據全都有。這個可以準確地知道車輛的出車率有多少,行程時間是多少。A9T行之道

    有些結果超乎我們的預料:A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8GxxV8JygB1pkqjPZcT8ASL5m3kSuGUqqpDpHsbprfMPPfG6qnvBxew/0?

    A9T行之道

    在北京,路網上最高峰的時候,僅有20%的車在路上,你能夠想象嗎?北京有600萬車,最高峰的時候100萬車在路上,就能把城市的路堵成這樣。這些數據說到底,是要驗證我們所做的工作是對還是錯。因為,出租車有出租車的特征,網約車也有網約車的特點。他們的特征是和小轎車不一樣的。A9T行之道



    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8BytFLdic8n21qWibia9t8SCZwfiaVSfV9HNjQstdXAU0fBkYLRHchibE5OQ/0?
    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx80tlA3iaZAqMrIKMYdib9kLNxTrUZEefb2iaoYDWPLvub2dPBSeETQyWibQ/0?
    A9T行之道

    通過數據,我們還可以知道哪位司機在什么地方突然急剎車,有不良駕駛行為。這里是不是設計的問題,還是紅綠燈控制的問題,等等。
    也有區域的分析(下圖)。A9T行之道

    https://mmbiz.qlogo.cn/mmbiz_jpg/ZKxpoW5ACbaJfyiby1Uh7156ffrAzcnx8lz8WiaLMntEmZEOLbvwf6icicwkOUXyDAlB12w8Yj79r2NNPicnWOJVnWw/0?
    A9T行之道

    居住區這一時刻有多少車,和辦公區域這一時刻有多少車,完全是不一樣的。
    交通大數據的未來
    A9T行之道

    大數據一定有一個美好的未來。我相信,未來我們每一個人需要的交通出行,是全方位的信息化,到目的地的每一個過程,都需要信息化。而不是僅為買一張票,在路上堵著。移動互聯網技術使得交通能做到這一點,以前不能做到,現在可以了。A9T行之道

    未來的交通,我們需要解決的問題很多。當出行者要在出行中與中心進行交互的時候,以及中心對出行者進行干預的時候,這些數據應該掌握在誰手里?如果這些技術被某個公司掌握之后,我們會是怎樣一個結果?給誰優化,不給誰優化?數據僅被某些人利用,是不公平的。我們交通工程師的責任是什么?我相信大家都有一個深度的思考。A9T行之道

    這是任何大數據都代替不了的工作,數據背后的智慧還是要靠我們。特別是未來響應式的交通系統、全方位信息化的交通系統,更需要我們的智慧。我完全相信,未來的交通系統,一定是控制在云端、交通參與者互動的系統,中心端可能要為全城交通負責。A9T行之道

    所以,在這方面,我們要堅持我們自己最基本的判斷力。最基礎的東西、最基本的規律是沒有變的,我們不要被這些數據搞暈了,自己要有定力,定力在于我們專業的判斷。我們希望業界規范起來,少花一點“為不同而不同”的時間,去做一些延展、深入的事情。數據共享固然重要,行業協作更加重要。A9T行之道

    (作者系北京交通發展研究院院長、教授級高級工程師。本文來自作者在第11屆中國智能交通大會上的演講,標題為編者所擬。原題為《交通大數據分析亟待規范:從指數亂象談起》)A9T行之道

      微信公眾號:MobilitySolution

    51色吧