Python培訓之5分鐘戰(zhàn)勝Python字符編碼(一)

更新時間:2016年08月26日17時21分來源:傳智播客python培訓學院瀏覽次數(shù):

1. 本文不談復雜的理論，就經驗教你字符處理八字真言：確定編碼，同類交互。

2. 文章針對Python 2.7，主要因為3對的編碼已經有了很大的改善并且實際原理一樣，更改一下操作命令即可。

3. 了解完本文，你可以輕松解決文字處理，特殊平臺（Windows?）下的編碼，爬蟲編碼等問題。

閱讀建議

本文分為如下幾個部分：

原理
具體操作
建議的使用習慣
疑難問題解答

如果想要了解我給出的使用習慣，可以直接跳到建議的使用習慣。

如果只想要解決相關問題可以直接跳到疑難問題解答。

希望本文能夠幫到你。

1. 原理

為了理解方便，這里不談理論只做類比，具體想要進一步了解各種編碼的理論的百度一下好了。

1. 首先說一下我們?yōu)槭裁磿龅礁魇礁鳂拥木幋a問題：

因為我們沒有統(tǒng)一編碼
因為我們沒有用對命令（傳對數(shù)據）

2. 再說一下編碼是什么，Python的編碼看似復雜，實際上可以看做只有兩類編碼：Unicode，二進制

Unicode 相信都很熟悉：，就是\u0000這樣的
二進制編碼也很簡單，就是\x00\x00這樣的，平?？吹降膗tf-8,cp936都是二進制編碼
二進制編碼是具象的，10001100原樣就可以存儲，而Unicode是抽象的，不能這樣存

#coding=utf8

# Unicode編碼演示
print('Unicode:')
print(repr('Unicode編碼'))`

# 二進制編碼演示
print(u'二進制編碼:')
print(repr('Unicode編碼'))`

# 這里只是看個樣子，代碼不必去深究

3. 再說怎么做，就是只有同種編碼之間才可以操作