互聯網視頻開放協議概述
《互聯網視頻開放協議》是搜狗影視制定的視頻搜索引擎視頻來源收錄標準,網站可以將您發布的視頻內容制作成遵照此開放協議的XML格式的網頁(獨立于網站原有的視頻發布形式),供搜狗搜索引擎索引,將網站發布的視頻及時的告知搜狗搜索引擎。
采用《互聯網視頻開放協議》,將會為您的網站帶去更多的流量!網民將在更大范圍內訪問到您網站中的視頻,進而為您的網站帶來潛在的流量。
您可以在我們的幫助下輕松使用該協議!
開放協議內容
遵循此開放協議的XML格式的網頁,如下圖所示,在網頁中按照標準格式列出您的網站發布的視頻的相關信息。
下圖為遵照《互聯網視頻開放協議》制作的XML格式的網頁,網頁上按照標準格式列出了網站發布的視頻的相關信息。
XML網頁示例:
XML標簽說明: 其中帶星號標記的為必選項,未帶星號標記為可選項。
*
<document>——標記整個XML文件內容的開始和結束。
*
<webSite>——站點地址。
*
<webMaster>——負責人員的Email。當有必要時,我們通過這個地址與您聯系。
*
<updatePeri>——更新周期,以分鐘為單位。搜索引擎將遵照此周期訪問該頁面,使頁面上的視頻更及時地出現在搜狗影視中。協議中只是一個參考值,搜狗影視會參考這個值定期地檢查您所提供的xml文件是否改變,檢查改變的方法是通過發送HEAD請求檢查xml文件的Last-Modified或Content-Length是否改變,來決定是否進行抓取。所以請務必確認您的服務器能返回Last-Modified或Content-Length其中一項,并且其值會根據您的xml文件的改變而改變。
*
<item>——標記每個視頻信息的開始和結束。標記內為單個視頻信息,不包括視頻專題。
*
<op>——標記視頻信息的操作類型,為add表示添加,為del表示刪除。
*
<title>——視頻標題(當op為del時也可不提供)。
*
<playLink>——視頻播放所在頁面url地址。
<index>——視頻的序號(也可不提供,搜索引擎會忽略該標簽)。
<imageLink>——視頻縮略圖的url地址。
視頻圖片為448x252或以上的橫版大圖(比例16:9)否則不予收錄。
<author>——視頻作者。
<videoLink>——視頻內容的url地址。
<category>——視頻類別信息,對視頻內容的大概分組,一般只有一個,支持多個。
<hd>——如該條數據為高清數據,請添加
標簽,后面標示為1。如非高清數據,則不要添加此標簽或置成0。高清標簽需要放在每條數據的所屬字段中,并請嚴格保證添加該字段的數據確實達到貴站判定的高清標準,該字段對結果排序影響較大,我們會定期審核,發現違規的xml接口一律下線。
<copyright>——如該條數據具有版權,請添加標簽,后面標示為1。如非版權數據,則不要添加此標簽或置成0。正版標簽需要放在每條數據的所屬字段中,并請嚴格保證添加該字段的數據確實為貴站的版權數據,該字段對結果排序影響較大,我們會定期審核,發現違規的xml接口一律下線。
<live>——如果該條數據是直播數據,請添加< live >標簽,后面標示為1。如非直播數據,則不要添加此標簽或置成0。直播標簽需要放在每條數據的所屬字段中,并請嚴格保證添加該字段的數據確實為貴站的直播數據,該字段對結果排序影響較大,我們會定期審核,發現違規的xml接口一律下線。直播數據一般是播放頁地址不變如http://s.sohu.com/live1/,貴站在該直播頁直播的內容發生變化時,把該條數據的title、tag、comment、duration、pubDate等和目前正在直播的內容的相關數據修改后重新提交該數據,搜狗會對數據重建索引,該直播能容能夠在線上被搜索到。對于直播數據,希望xml接口的內容更新頻率能快些,以保證直播的數據能夠及時被檢索到。
<mPlayLink>——移動端視頻播放所在頁面url。此字段的url將在wap端展現,不填則此條數據,在移動端不展現。字段支持可選屬性support,support的值目前有三種選項all/android/ios,分別代表所有移動端可播/Android可播/IOS可播;若無此屬性,默認“所有移動端可播”;support不同的情況下,可提交多個mPlayLink字段。備注:playLink標簽意義不變,為必填項,表示PC端展現地址,勿填錯!若存在只有移動端可播,PC端不可播的情況,請聯系本站產品!
<swfurl>——視頻的flash資源地址。
<downloadLink>——下載視頻所用的url,可能和videoLink一致。
<format>——視頻格式(如:mp4,m3u8等)。
<bitrate>——視頻碼率,單位kps。
<resolution>——視頻分辨率(如:352*288)。
<tag>——視頻分類信息。
<comment>——視頻注釋信息。
<duration>——視頻播放時間。以秒為單位。
<pubDate>——視頻發布時間,與該視頻播放頁面上的發布時間保持一致。請精確到分鐘;若您網站的發布時間未記錄小時分鐘,提供年月日即可。
推薦時間格式:年月日小時分鐘秒
如:2005-11-09 10:37:34
開放協議的使用
使用協議之前,您需要了解以下幾點:
1. 無論您的網站是否已經成為搜狗的視頻源,都可以使用此開放協議。
2. 您使用開放協議所提供的內容應該全部符合下面的《視頻源收錄標準》。
3. 《互聯網視頻開放協議》只是原始視頻源收錄方式的一種有益補充,而不是完全取代。
視頻源收錄標準:
搜狗希望視頻源多樣化,鼓勵原創視頻內容。搜狗收錄視頻源的基本原則是具有大量有價值的視頻內容并能夠及時更新的正規、合法的網站,且網站服務器穩定、高速。
搜狗影視收錄任何類型的視頻,不過您應對所提供的全部內容承擔一切法律責任,保證您所提供內容的真實性、合法性,并且不得侵犯任何第三方的權益。
XML文件的最小更新周期為5分鐘,小于5分鐘,搜狗影視將不能保證能及時獲取您更新的數據。
XML文件的大小最大為10M,大于10M的文件搜狗影視將不能保證正確獲取。
XML文件提供的視頻數據請保證至多是最近7天內的數據,對于7天前的數據搜狗影視將不予抓取。如果您的站點想提供7天前的數據,請聯系我們,同時提供另一個臨時URL地址,讓搜狗影視訪問索取,這個臨時地址的XML文件不可超過2G。如果文件較大,建議分為多個文件,提供多個URL地址。
具體步驟:
第一步:創建XML文件
請按照上面公布的開放協議內容制作XML文件。
其它說明:
·支持的編碼格式有GB18030、UTF-8、GB2312、BIG5等,推薦使用GB18030和UTF-8。注意:XML文件頭部的encoding值必須與XML文件的實際編碼類型一致。
·您可以將網站某一時間段發布的全部視頻放在一個XML文件中,也可以分頻道或欄目放在多個XML文件中。
·網站審批未通過的視頻,或者用戶設為私有的視頻,不建議進行提交。如果已經提交,建議通過DEL標記進行刪除。
·請保持每個XML文件處于按更新周期持續自動更新狀態。
·XML標簽內容中的一些特殊字符需要轉換為XML定義的轉義字符,否則將發生錯誤導致搜索引擎不能獲取頁面上的視頻,
具體參見下表。如不想轉義,則必須使用CDATA標記內容,如"XML網頁示例"所示。
字符 |
轉義后的字符 |
HTML字符 |
字符編碼 |
和(and) |
& |
& |
& |
單引號 |
' |
' |
' |
雙引號 |
" |
" |
" |
大于號 |
> |
> |
> |
小于號 |
< |
< |
< |
第二步:驗證XML文件
可以采用xmlspy或firefox對XML文件進行驗證。更多驗證工具,可參見下面地址:
http://www.w3.org/XML/Schema#Tools
http://www.xml.com/pub/a/2000/12/13/schematools.html
通過驗證的XML文件能夠使您提供的信息更加標準,確保您發布的視頻信息不被搜狗搜索引擎遺漏。
第三步:提交XML網址
提交前請將XML文件上傳到您的網站服務器,將XML文件的URL地址及其它信息輸入下面對應的方框內。搜索引擎將定向訪問該URL地址,當URL地址發生變化時需要重新提交。搜狗影視將對您提交的數據進行測試和觀察一段時間,若您基本按照 《互聯網視頻開放協議》的要求進行制作但存在問題,我們會根據XML頁面上提供的郵件地址與您聯系。
注意: 搜狗影視不保證一定能收錄您提交的全部內容。
如有疑問,請聯系我們。