也就是说,您如何区分存档(jar/rar/等)文件和文本(xml/txt,与编码无关)文件?
没有保证的方法,但这里有几种可能性:
-
查找文件上的标头。不幸的是,标头是特定于文件的,因此虽然您可能能够发现它是 RAR 文件,但您不会得到更通用的答案,即它是文本还是二进制。
-
计算字符与非字符类型的数量。文本文件主要是字母字符,而二进制文件(尤其是 rar、zip 等压缩文件)往往会更均匀地表示字节。
-
寻找定期重复的换行模式。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)