XmlDocument.LoadXml上的坑
XmlDocument加载xml文档,可以用Load加载实体文件,也可以用LoadXml加载字符串,但是使用的时候有个小坑需要注意。先来看以下几行代码:
varxml=newXmlDocument();xml.Load("test.xml");//<---方法1xml.LoadXml(File.ReadAllText("test.xml",Encoding.UTF8));//<---方法2xml.LoadXml(Encoding.UTF8.GetString(File.ReadAllBytes("test.xml")));//<---方法3
运行一下,会发现方法1和2没什么区别,但方法3会报错:
System.Xml.XmlException:根级别上的数据无效。第1行,位置1。
原因出在UTF8的BOM上,Windows系统下,UTF8文件保存会在头部保存3个字节,EF BB BF,如果按文本方式处理文件(File.ReadAllText),得到的字符串是不会包含这3个不可见字符的,但如果用二进制方式处理文件再转字符串(File.ReadAllBytes再GetString),得到的字符串就有问题了,导致XmlDocument认为XML格式不合法。
对本地文件来说,一般不太可能用到方法3,但是如果是从远程接收文件,就会遇到与方法3类似的情况了,此时需要识别一下,如果有BOM,要去除掉再转化字符串。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。