-
Notifications
You must be signed in to change notification settings - Fork 8
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
lrc歌词相关编码没有适配 #4
Comments
|
好 |
请增加越南TCVN编码,谢谢! |
你好,你的附件好像没有上传成功,我这边没法正常下载。 希望你能提供给我尽可能多的测试文本。 |
SmartCharsetConverter(测试分支,非正式分支)现在内置了3个字符集探测引擎,我尝试了,首先它们都没有越南tcv3的字符集支持,其次,它们有时会把越南语文本识别为iso-8859-10,这个字符集是用来显示带重音符号的欧洲字符的,看起来和越南文还有点像。 我把你提供的示例按照iso-8859-10进行识别,再转换utf-8。好在有你提供的工具,否则我无法判断转换结果是否正确。我交叉比对了,这样做不行。转到utf-8的字符和JxLuaEditor1.0处理的结果不一致。 |
tcvn3编码已支持。不确定是否有其他的问题,所以希望你能试用一下然后给我反馈。 |
你好,ANSI不是一个严格定义的编码集,其实是指“windows上的随系统地区设置而变动的多字节编码集”。
对于SmartCharsetConverter而言,现在的字符集探测引擎不能探测出拉丁字母以外的文本内容太少的情况。比如,你给的例子里面,只有“恩雅”两个字是中文,其他都是英文。对于探测引擎而言,“恩雅”两个字符完全可以表示为其他字符集中的合法内容。比如,GBK编码的恩雅两个字解码为日文或者韩文编码,也完全可能是有意义的单词。
所以这种情况无法探测。
所以不是ANSI无法识别,而是有效字符太少的情况下无法识别。
…---原始邮件---
发件人: ***@***.***>
发送时间: 2024年6月16日(周日) 下午3:07
收件人: ***@***.***>;
抄送: "Tom ***@***.******@***.***>;
主题: Re: [tomwillow/SmartCharsetConverter] lrc歌词相关编码没有适配 (Issue #4)
image.png (view on web)
image.png (view on web)
貌似无法添加 ANSI 这类编码的文本文件,只能手动一个个的改了。 /(ㄒoㄒ)/~~
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you commented.Message ID: ***@***.***>
|
对了,不必一个一个改。可以先使用“不过滤”模式添加,然后在列表框里按shift在点选。或者按住ctrl多选。
…---原始邮件---
发件人: ***@***.***>
发送时间: 2024年6月16日(周日) 下午3:07
收件人: ***@***.***>;
抄送: "Tom ***@***.******@***.***>;
主题: Re: [tomwillow/SmartCharsetConverter] lrc歌词相关编码没有适配 (Issue #4)
image.png (view on web)
image.png (view on web)
貌似无法添加 ANSI 这类编码的文本文件,只能手动一个个的改了。 /(ㄒoㄒ)/~~
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you commented.Message ID: ***@***.***>
|
lrc编码集需新增:EUC-JP(最急),IBM852,Big5,ISO-8859-9,ISO-8859-3,Windows-1252(主要是名称上的变化,内置的好像是WINDOWS-1252),MAC-CENTRALEUROPE,Windows-1250
另外,还有一个文件 ,没有被识别为文本文件,可是它的确是文本文件,你看一下是哪里有问题。
澤野弘之 (さわの ひろゆき) - THE ANSWER.zip
The text was updated successfully, but these errors were encountered: