Java处理UFT-8编码文件出现\ufeff的解决方法

在处理支付宝、微信支付等对账文件时可能会碰到因为\ufeff字符导致字段解析错误。\ufeff这是哪来的呢?网上搜索后发现原来是文本保存时包含了BOM(Byte Order Mark,字节顺序标记,出现在文本文件头部,Unicode编码标准中用于标识文件是采用哪种格式的编码)导致的,解决方法是使用utf-8-sig编码(无BOM格式):

如果文件编码格式不可变更,则删除\ufeff即可

@Override
protected List<String> parseColumnNames(List<String> lines) {
    return convertToList(lines.get(0).replace("\ufeff", ""), split);
}

版权声明:
作者:Joe.Ye
链接:https://www.appblog.cn/index.php/2023/02/25/solution-to-processing-uft-8-encoding-file-error-with-java/
来源:APP全栈技术分享
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
打赏
海报
Java处理UFT-8编码文件出现\ufeff的解决方法
在处理支付宝、微信支付等对账文件时可能会碰到因为\ufeff字符导致字段解析错误。\ufeff这是哪来的呢?网上搜索后发现原来是文本保存时包含了BOM(Byte Order ……
<<上一篇
下一篇>>
文章目录
关闭
目 录