Windows环境下用系统自带的txt文本编辑器编辑的文本内容当使用UTF-8编码时,会自做主张的在内容开头添加三个用以标识为UTF-8编码的字节。所以在解析时可以先判断是否存在这三个字节(具体哪三个字节值,望自行测试),然后进行剔除。不存在则正常解析。
版权声明:本文为HSHH_7244原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。
Windows环境下用系统自带的txt文本编辑器编辑的文本内容当使用UTF-8编码时,会自做主张的在内容开头添加三个用以标识为UTF-8编码的字节。所以在解析时可以先判断是否存在这三个字节(具体哪三个字节值,望自行测试),然后进行剔除。不存在则正常解析。