免费高清特黄a大片,九一h片在线免费看,a免费国产一级特黄aa大,国产精品国产主播在线观看,成人精品一区久久久久,一级特黄aa大片,俄罗斯无遮挡一级毛片

分享

漫談今日頭條、大數(shù)據(jù)與智能推薦算法

 京城客家人老黃 2017-04-05

漫談今日頭條、大數(shù)據(jù)與智能推薦算法

又幾天沒和大家聊天了,最近個人有點毛燥,需多吃些草,沉淀一下,擠出精力來寫技術(shù)文章。我盡量寫有用的,寫書的人容易用書面語,文白混雜,大家湊和著看,歡迎來人來函來稿。

其實在互聯(lián)網(wǎng)生活里,內(nèi)容推薦技術(shù)已經(jīng)無處不在了。

我從Amazon買了一本《時間簡史》,回過頭來再瀏覽,它可能推薦我可能喜歡《未來簡史》,或者推薦《PHP高性能應(yīng)用開發(fā)與實踐》(它還沒智能到知道是我寫的,歡迎大家支持,一個知識分子碼農(nóng)能說這樣的話也是夠了 ^_^)。

漫談今日頭條、大數(shù)據(jù)與智能推薦算法

我登錄YouTube上看小電影,它推薦我可能喜歡的視頻。友情提示,如果電腦是共用的,同學(xué)們千萬要注意哦~

為了支持小扎,我上Facebook,它會推薦哪些朋友更新,哪些人你可能認識。最要命是它會推薦一些你可能喜歡的美女,要注意這些人可能只是照片長得好看...

今日頭條一打開,就給我推薦互聯(lián)網(wǎng)相關(guān)的內(nèi)容,還給我推薦單身攻略,婚姻修養(yǎng),歷史鉤沉,社會雜聞,還有我這九零后看不懂得的段子,是名符其實的『今日辣條』。實在忒low,我這么高雅的人,這種低級趣味真是看夠了。

渣浪的媒體優(yōu)勢越來被機器替代,每個頻道也開始了個性化探索,微博上除了可能感興趣的人外,信息流里也開始展現(xiàn)哪條微博可能我有興趣,

搜狐等老牌門戶也被倒逼,做起來了個性化新聞,話說我們21CTO社區(qū)微信號已經(jīng)被入駐。

低頭族除了玩手機,然后就是塞著耳機聽音樂,網(wǎng)易云音樂。QQ音樂,蝦米

掌握了你的重口味。

要查看其它語言的網(wǎng)站,Google會幫我們自動翻譯27國語言。更逆天的是,它竟然能夠翻譯視頻里的字,比如把可口可樂的英文說明轉(zhuǎn)成中文,可以把英文字幕轉(zhuǎn)成中文。最新的翻譯包括語音翻譯、點按翻譯、實景翻譯、離線翻譯,有圖有真像!

漫談今日頭條、大數(shù)據(jù)與智能推薦算法

標準機械化的文章完全可以取代編輯,由機器人來代寫了。特別是導(dǎo)購類,新聞資訊文章,大家敢快學(xué)語文去。

查找航班,買火車票,機器幫我們預(yù)測票價,自動搶票等能力。

還有購買基金,選股票神馬的。像前段時間支付寶同學(xué)執(zhí)著的想加入社交,產(chǎn)品經(jīng)理們都開始拉妹子在線了,就差沒做出『你附近的有錢人』,這樣,怕是沒人敢用支付寶了。

當然最常用的場景,Siri或點評推薦我們附近的餐館,地圖導(dǎo)航應(yīng)用,微信中查看附近的人(我覺得它倒該做一個像Facebook那樣你感興趣的人)等幫助我們程序員們交友。

這些后端都來自于機器學(xué)習(xí)算法。機器學(xué)習(xí)算法屬于人工智能領(lǐng)域的一個分支。它從一堆數(shù)據(jù)中推斷,然后再理解后做事,掌握的數(shù)據(jù)越多,機器推薦地越準確。相當于自己給自己編程。

在這里,我們程序員們充當了小神靈(創(chuàng)造算法并將其編碼的人),創(chuàng)建創(chuàng)意不同的世界。

頭條們?nèi)绾巫鐾扑]

說到機器算法,智能推薦,都會提到今日頭條或一點資訊這些內(nèi)容產(chǎn)品。

今日頭條是主要基于移動互聯(lián)網(wǎng)(手機客戶端)的產(chǎn)品,當然也有Web(PC端)。

內(nèi)容強調(diào)更新快,強調(diào)推送,而非傳統(tǒng)的展示或刷新,提供的內(nèi)容更“精準”,做到千人千面和資訊時效性。

它的內(nèi)容推送完全基于機器算法,減少小編人為干預(yù),不斷訓(xùn)練和提高自己,并獲得內(nèi)容變現(xiàn)和成本上的好處。

移動互聯(lián)網(wǎng)為今日頭條的興起提供了紅利,手機現(xiàn)在和用戶如影隨形,這就產(chǎn)生了大量碎片化的富余時間,同時手機的便利性也為時效性的競爭提供了空間,可以重新定義用戶價值,于是信息流的內(nèi)容提供模式有了用武之地,而在PC端,用戶的時間和便利性受到的壓縮,使得信息流的價值難以體現(xiàn)出來。

頭條的推薦機制

第一次安裝了今日頭條,你打開APP時,它會記住用戶手機的操作系統(tǒng),版本,屏幕,遍歷用戶安裝的App,瀏覽器的Cookie、收藏夾,客戶端網(wǎng)絡(luò),LBS地址如北京市海淀區(qū)等信息,這樣在用戶未登錄的情況下,能夠通過這些基本的Profile做一個基礎(chǔ)畫像。

如果用戶使用微博,QQ等社交平臺登錄后,內(nèi)容APP會對這些社交平臺的好友關(guān)系、微博內(nèi)容,粉絲性質(zhì),評論等維度,能夠有更詳細的用戶畫像。

至于今日頭條的文章內(nèi)容,一部分來自于機器抓取,一部分來自合作伙伴,也就是頭條號,類似于微信公眾平臺。

余下的,頭條根據(jù)我們的閱讀文章的分類,喜好興趣,閱讀時長,發(fā)表評論等維度進行更清晰的畫像,然后推薦給我們。

有一個非?,F(xiàn)實的例子。你有一個非常喜歡的妹子,你每天盼著和她聊天,每次聊天,有時候很好,這時候你想約她出來。但是如果遭到拒絕,你又很難過。又到周五時,你拿著手機考慮要不要給她電話,隱約記得上次你問過她,被她拒絕了。可是明明的兩回她是答應(yīng)的,前一次又拒絕了呢?是不是她不想出門,還是她喜歡小黑屋,不喜歡泡吧?喜歡吃包子,不喜歡吃披薩?你百思不得其姐,細思恐極。

于是你先放下天天拿著的手機,默默地做了個下面類似機器算法的表格:

漫談今日頭條、大數(shù)據(jù)與智能推薦算法

那么,我們試圖從此表格中來找尋規(guī)律。

但是很明顯,有時候約會和自己的發(fā)現(xiàn)這狀態(tài)有關(guān),還有的時候取決于她的情緒,明明天氣很好,但是她的脾氣卻很壞,還有每次兩個人說的話都不會重樣,這樣一來,機器算法也無法預(yù)測答案,因此,這樣的場景就不適合用大數(shù)據(jù)和機器算法,它適合于規(guī)律和標準化的數(shù)據(jù)。

但是它能總能給我們一些啟示,特別是一些糊里糊涂,天天就知道寫代碼的人——就像我這樣的,拖延狂還有碼農(nóng)綜合癥,忘記生活,需要有大數(shù)據(jù)來嚴重介入。

不知道愚人節(jié)大家被騙了幾回,反正我中午吃了一頓烤馕。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多