您的位置:首頁技術文章
文章詳情頁

Python無法正確排序unicode。Strcoll沒有幫助

瀏覽:2日期:2022-08-07 10:45:34
如何解決Python無法正確排序unicode。Strcoll沒有幫助?

顯然,在所有平臺上進行排序的唯一方法是使用具有PyICU綁定的ICU庫(在PyPI上為PyICU)。

在OS X:上sudo port installpy26-pyicu,請注意此處描述的錯誤:https ://svn.macports.org/ticket/23429(使用Macports的樂趣)。

不幸的是,嚴重缺乏PyICU的文檔,但是我設法找出了它的完成方法:

import PyICUcollator = PyICU.Collator.createInstance(PyICU.Locale(’pl_PL.UTF-8’))print [i for i in sorted([u’a’, u’z’, u’?’], cmp=collator.compare)]

這使:

[u’a’, u’?’, u’z’]

另一個優點-@bobince:它是線程安全的,因此在設置請求方式的語言環境時并非沒有用。

解決方法

我在OSX和Linux上的Python 2.5.1和2.6.5中使用Unicode排序規則對列表進行排序時遇到問題。

import locale locale.setlocale(locale.LC_ALL,’pl_PL.UTF-8’)print [i for i in sorted([u’a’,u’z’,u’?’],cmp=locale.strcoll)]

應該打?。?/p>

[u’a’,u’?’,u’z’]

而是打印出來:

[u’a’,u’?’]

總結一下-好像strcoll壞了。嘗試了各種類型的變量(例如非Unicode編碼的字符串)。

我做錯了什么?

最好的問候,Tomasz Kopczuk。

標簽: Python 編程
相關文章:
国产综合久久一区二区三区