跳至內容

用戶討論:FRDian/Wordcount.js

頁面內容不支援其他語言。
維基百科,自由的百科全書

Unicode Non-BMP 判別[編輯]

@FRDian 由於 JavaScript UTF-16 強當 UCS-2 的缺陷,一些字例如「𨋢」(U+282E2)會顯示成 2CJK(Surrogate Pair 兩半), 4 bytes(UTF-8 報告倒是對了)。--Arthur2e5 更改·工具 2016年5月7日 (六) 21:39 (UTC)[回覆]

呃,那我再@Liangent一下吧。--Altoria2e5 更改·工具 2016年5月10日 (二) 11:41 (UTC)[回覆]
我把小工具的版本改成了[1]提供的regex,看起來舉例的文字沒有問題了。這個衍生版本我就不管了。Liangent留言 2016年5月10日 (二) 21:55 (UTC)[回覆]
@Arthur200000完成。#ForeverLove凡人丶 你一定要好好的 中文字數統計工具 2016年5月11日 (三) 02:49 (UTC)[回覆]
@FRDian 似乎 char count text.length 這邊還是需要類似地修一下。text.replace(/[\uD800-\uDBFF][\uDC00-\uDFFF]/g, '_').length 就行。--Altoria2e5 更改·工具 2016年5月11日 (三) 04:44 (UTC)[回覆]
@Liangent慢着,現在這幾個版本我開始搞不清了……什麼時候誰寫個幫助頁吧(汗)--Altoria2e5 更改·工具 2016年5月11日 (三) 04:52 (UTC) 啊看到MediaWiki_talk:Gadget-Wordcount.js了。[回覆]
@Arthur200000,我...沒太明白...#ForeverLove凡人丶 你一定要好好的 中文字數統計工具 2016年5月11日 (三) 14:31 (UTC)[回覆]