如何读取包含 HTML 的 Lync 对话文件？

2024-03-25

我在 C# 中将本地文件读入字符串时遇到问题。

到目前为止，这是我想到的：

 string file = @"C:\script_test\{5461EC8C-89E6-40D1-8525-774340083829}.html";
 using (StreamReader reader = new StreamReader(file))
 {
      string line = "";
      while ((line = reader.ReadLine()) != null)
      {
           textBox1.Text += line.ToString();
      }
 }

这似乎是唯一有效的解决方案。

我尝试了一些其他建议的读取文件的方法，例如：

string file = @"C:\script_test\{5461EC8C-89E6-40D1-8525-774340083829}.html";
string html = File.ReadAllText(file).ToString();
textBox1.Text += html;

但它并没有按预期工作。

这是我要读取的文件的前几行：

正如你所看到的，它有一些时髦的角色，老实说，我不知道这是否是这种奇怪行为的原因。

但在第一种情况下，代码似乎跳过了这些行，仅打印“Office Communicator 生成的文档...”

如果您可以使用 API 或 SDK，甚至有您尝试阅读的格式的描述，那么您的任务会更容易。然而，二进制格式看起来并没有那么复杂，并且带有一个十六进制查看器 https://i.stack.imgur.com/X3f7M.png安装我到目前为止已经从您提供的示例中获取了 html。

要解析非文本文件，您可以回退到二进制阅读器 https://msdn.microsoft.com/en-us/library/system.io.binaryreader(v=vs.110).aspx然后使用其中之一读取方法 https://msdn.microsoft.com/en-us/library/system.io.binaryreader_methods(v=vs.110).aspx从字节流中读取正确的类型。我用了ReadByte https://msdn.microsoft.com/en-us/library/system.io.binaryreader.readbyte(v=vs.110).aspx and 读Int32 https://msdn.microsoft.com/en-us/library/system.io.binaryreader.readint32(v=vs.110).aspx。请注意该方法的描述中如何解释读取了多少字节。当您尝试破译您的文件时，这会变得很方便。

    private string ParseHist(string file)
    {
        using (var f = File.Open(file, FileMode.Open))
        {
            using (var br = new BinaryReader(f))
            {
                // read 4 bytes as an int
                var first = br.ReadInt32();
                // read integer / zero ended byte arrays as string
                var lead = br.ReadInt32();
                // until we have 4 zero bytes
                while (lead != 0)
                {
                    var user = ParseString(br);
                    Trace.Write(lead);
                    Trace.Write(":");
                    Trace.Write(user.Length);
                    Trace.Write(":");
                    Trace.WriteLine(user);
                    lead = br.ReadInt32();
                    // weird special case
                    if (lead == 2)
                    {
                        lead = br.ReadInt32();
                    }
                }

                // at the start of the html block
                var htmllen = br.ReadInt32();
                Trace.WriteLine(htmllen);
                // parse the html
                var html = ParseString(br);
                Trace.Write(len);
                Trace.Write(":");
                Trace.Write(html.Length);
                Trace.Write(":");
                Trace.WriteLine(html);
                // other structures follow, left unparsed

                return html.ToString();
            }
        }
    }

    // a string seems to be ascii encoded and ends with a zero byte.
    private static string ParseString(BinaryReader br)
    {
        var ch = br.ReadByte();
        var sb = new StringBuilder();
        while (ch != 0)
        {
            sb.Append((char)ch);
            ch = br.ReadByte();
        }
        return sb.ToString();
    }

您可以在 winform 应用程序中使用简单的解析逻辑，如下所示：

    private void button1_Click(object sender, EventArgs e)
    {
        webBrowser1.DocumentText = ParseHist(@"5461EC8C-89E6-40D1-8525-774340083829-Copia.html");
    }

请记住，这不是防弹或推荐的方法，但它应该可以帮助您入门。对于无法很好解析的文件，您需要返回到十六进制查看器并找出哪些其他字节结构是新的或与您已有的不同。这不是我打算帮助你的事情，而是作为练习留给你去弄清楚。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何读取包含 HTML 的 Lync 对话文件？的相关文章

进程何时获得 SIGABRT（信号 6）？

C 中进程获得 SIGABRT 的场景有哪些该信号是否始终来自进程内部或者该信号可以从一个进程发送到另一个进程吗有没有办法识别哪个进程正在发送该信号 abort 向调用进程发送SIGABRT信号就是这样abort 基本上有效 abo
C++：重写已弃用的虚拟方法时出现弃用警告

我有一个纯虚拟类它有一个纯虚拟方法应该是const 但不幸的是不是该接口位于库中并且该类由单独项目中的其他几个类继承我正在尝试使用这个方法const不会破坏兼容性至少在一段时间内但我找不到在非常量方法重载时产生警告的方法以下
从多个类访问串行端口

我正在尝试使用串行端口在 arduino 和 C 程序之间进行通信我对 C 编程有点陌生该程序有多种用户控制形式每一个都需要访问串口来发送数据我需要做的就是从每个类的主窗体中写入串行端口我了解如何设置和写入串行端口这是我的 Fo
暂停下载线程

我正在用 C 编写一个非常简单的批量下载程序该程序读取要下载的 URL 的 txt 文件我已经设置了一个全局线程和委托来更新 GUI 按下开始按钮即可创建并启动该线程我想要做的是有一个暂停按钮使我能够暂停下载直到点击恢复
如何从 C# 控制器重定向到外部 url

我使用 C 控制器作为网络服务在其中我想将用户重定向到外部网址我该怎么做 Tried System Web HttpContext Current Response Redirect 但没有成功使用控制器的重定向 http msdn
当前的 c++ 工作草案与当前标准有何不同

通过搜索该标准的 PDF 版本我最终找到了这个链接C 标准措辞草案 http www open std org jtc1 sc22 wg21 docs papers 2012 n3376 pdf从 2011 年开始我意识到我可以购买最终
如何将“外部模板”与由同一类中的模板化成员使用的嵌套类一起使用？

首先一些背景信息我尝试以 Herb Sutter 在他的解决方案中介绍的方式使用 Pimpl 习语得到了 101 http herbsutter com gotw 101 这在头文件中看起来像这样 include pimpl h h
即使手动设置显示环境变量后，WSL Ubuntu 也会显示“错误：无法打开显示”

我在 WSL Ubuntu 上使用 g 我使用 git 克隆了 GLFW 存储库使用了ccmake命令配置并生成二进制文件然后使用make在 build 目录中最终创建 a文件我安装了所有OpenGL相关的库 usr ld 我不记得我
在 2D 中将一个点旋转另一个点

我想知道当一个点相对于另一个点旋转一定角度时如何计算出新的坐标我有一个块箭头想要将其相对于箭头底部中间的点旋转角度 theta 这是允许我在两个屏幕控件之间绘制多边形所必需的我无法使用和旋转图像从我到目前为止所考虑的情况来看使问题
Qt 创建布局并动态添加小部件到布局

我正在尝试在 MainWindow 类中动态创建布局我有四个框架它们是用网格布局对象放置的每个框架都包含一个自定义的 ClockWidget 我希望 ClockWidget 对象在调整主窗口大小时相应地调整大小因此我需要将它们添加到
为什么我不应该对不是由 malloc() 分配的变量调用 free() ？

我在某处读到使用它是灾难性的free删除不是通过调用创建的对象malloc 这是真的为什么这是未定义的行为永远不要尝试它让我们看看当您尝试时会发生什么free 自动变量堆管理器必须推断出如何获取内存块的所有权为此它要么必须使
通过 NHibernate 进行查询，无需 N+1 - 包含示例

我有一个 N 1 问题我不知道如何解决它可以在这个问题的底部找到完全可重复的样本因此如果您愿意请创建数据库设置 NUnit 测试和所有附带的类并尝试在本地消除 N 1 这是我遇到的真实问题的匿名版本众所周知这段代码对于帮助
当“int”处于最大值并使用 postfix ++ 进行测试时，代码定义良好吗？

示例未定义行为的一个示例是整数溢出的行为 C11dr 3 4 3 3 int溢出是未定义的行为但这是否适用于存在循环的以下内容并且不使用现在超出范围的副作用i 特别是这是否后缀增量规格帮助结果的值计算在副作用之前排序更新操作数的
在 C 中使用 GNU automake 中的解析器

我是 GNU autotools 的新手在我的项目中使用了 lex 和 yacc 解析器将它们作为 makefile am 中的源代码会产生以下错误配置 in AC CHECK PROGS YACC bison yacc none i
如何挤出平面 2D 网格并赋予其深度

我有一组共面连接的三角形即二维网格现在我需要将其在 z 轴上挤出几个单位网格由一组顶点定义渲染器通过与三角形数组匹配来理解这些顶点网格示例顶点 0 0 0 10 0 0 10 10 0 0 10 0 所以这里我们有一个二维正方
如何一步步遍历目录树？

我发现了很多关于遍历目录树的示例但我需要一些不同的东西我需要一个带有某种方法的类每次调用都会从目录返回一个文件并逐渐遍历目录树请问我该怎么做我正在使用函数 FindFirstFile FindNextFile 和 FindClo
g++ 对于看似不相关的变量“警告：迭代...调用未定义的行为”

考虑以下代码strange cpp include
使用 C# 从 DateTime 获取日期

愚蠢的问题给定日期时间中的日期我知道它是星期二例如我如何知道它的 tue 2 和 mon 1 等 Thanks 您正在寻找星期几 http msdn microsoft com en us library system datetim
使用 Crypto++ 获取 ECDSA 签名

我必须使用 Crypto 在变量中获取 ECDSA 签名我在启动 SignMessage 后尝试获取它但签名为空我怎样才能得到它你看过 Crypto wiki 吗上面有很多东西椭圆曲线数字签名算法 http www cryptop
匿名结构体作为返回类型

下面的代码编译得很好VC 19 00 23506 http rextester com GMUP11493 标志 Wall WX Za 与VC 19 10 25109 0 标志 Wall WX Za permissive 这可以在以下位置检

随机推荐

Lucene 查询解析器在查询条件中带有“/”

当我尝试在 Lucene 中搜索诸如解决方法修复之类的内容时它会抛出此错误 org apache lucene queryparser classic ParseException Cannot parse workaround f
带有 ArrayBlockingQueue 的 ThreadPoolExecutor

当我在我的一个项目中使用 ThreadPoolExecutor 时我开始从 Java Doc 中阅读更多有关 ThreadPoolExecutor 的内容那么谁能解释一下这行代码实际上意味着什么我知道每个参数代表什么但我想从这里的一
从 App Engine 运行时 Python 3.7 调用 Cloud Function [重复]

这个问题在这里已经有答案了我有一个运行 Python 3 7 的 App Engine 服务需要通过以下方式调用我的云函数之一并获取响应https oncall扳机我想我可以通过以下方式做到这一点 import logging fro
FB Graph / FQL：当 FB 页面显示位置时，朋友的 Current_location 有时会显示 Null

我试图在 Facebook 上获取用户所有朋友的当前位置但遇到了一个奇怪的问题当我在他们的实际 Facebook 页面上看到住在时其中一些朋友正在读出 NULL 这个错误的困难之处在于它只发生在大约 30 的情况下在其余情况下
Angularjs：服务多个 $resource url / 数据源的服务？

我有一个 Angular 服务提供程序它向我的控制器提供 json 数据效果很好 angular module myApp services ngResource factory statesProvider function res
SOAP-错误：编码：对象没有属性

我需要创建一个 SOAP 请求如下所示
查找两个数据集之间的交集

我正在生成两个与此类似的数组 x y z sphere A x y z B x 0 5 y 0 5 z 0 5 第二个数组与第一个数组有一定的偏移量我想找到这两个数组 A 和 B 的交集空间在本例中我使用了 sphere 函数但是可以
为什么Java没有复制构造函数？

为什么 Java 不像 C 那样支持复制构造函数 Java 确实如此它们只是不像 C 中那样被隐式调用我怀疑这是你真正的问题首先复制构造函数无非是 public class Blah private int foo public B
ES6 是否为对象属性引入了明确定义的枚举顺序？

ES6 是否为对象属性引入了明确定义的枚举顺序 var o 1 1 a 2 b 3 Object keys o 1 a b is this ordering guaranteed by ES6 for let k in o console
在 PIL 中保存 GIF 时透明度不一致

我正在编写可以覆盖图像并使背景透明的脚本输出应该是 GIF 格式该脚本有效但对于某些图像透明度未按预期工作这是脚本 from PIL import Image from PIL import ImageDraw from PIL
我们应该如何解释 H2O 预测函数的结果？

我已经训练并存储了一个随机森林二元分类模型现在我正在尝试使用此模型模拟处理新的样本外数据我的Python Anaconda 3 6 代码是 import h2o import pandas as pd import sys loca
matplotlib 中的虚线而不是缺失值

我有一些数据的数组其中缺少一些值 y np array np NAN 45 23 np NAN 5 14 22 np NAN np NAN 18 23 当我绘制它时我缺少这些 NAN 这是预期的 fig ax plt subplots
$rootScope.$broadcast 与 $scope.$emit

现在性能差异 broadcast and emit已经被淘汰了还有什么理由选择 scope emit to rootScope broadcast 他们是不同的是的 emit仅限于范围层次结构向上如果它适合您的设计这可能很好但
在 databricks 笔记本中使用多个 Spark 连接

我想使用 Spark 和 Sparklyr 连接到单个 databricks R 笔记本中的两个数据库表 sc one lt spark connect method databricks tbl change db sc one firs
了解 Node.js 模块：多个要求返回相同的对象？

我有一个相关问题有关模块缓存的 Node js 文档 http nodejs org docs latest api modules html caching 模块在第一次加载后会被缓存这意味着除其他外每次调用 require foo
这个 cron 表达式是否意味着每隔一个星期日？

下面的 cron 表达式的意思是每隔一个星期日执行一次吗 0 0 3 2 1 我正在尝试将它与 Spring Quartz 调度程序一起使用您询问周一至周六凌晨 3 点发生火灾的表达方式从Quartz Javadoc http ww
从 .ToString("{0:C}") 格式的数字中删除 $

基本上我是这样格式化数字的 String Format 0 C Model Price 结果是 2 320 000 00 然而我想要的结果是2 320 000 00只是没有分别我怎样才能实现这一点同时仍然利用 nets 本地化处理 E
Autofac - 动态解析带有参数的组件

我有一个类它采用接口作为构造函数参数该接口有两种实现我想根据变量决定在运行时使用哪种实现问题是上面的类位于由 Autofac 解决的对象层次结构深处因此我无法传入参数我想要实现的目标如下所示 public interface I
FormsAuthenticationTicket isPersistent 属性的用途是什么？

我正在努力弄清楚这个目的isPersistent发现的财产FormsAuthenticationTicket class http msdn microsoft com en us library kybcs83h aspx http ms
如何读取包含 HTML 的 Lync 对话文件？

我在 C 中将本地文件读入字符串时遇到问题到目前为止这是我想到的 string file C script test 5461EC8C 89E6 40D1 8525 774340083829 html using StreamReade

如何读取包含 HTML 的 Lync 对话文件？

如何读取包含 HTML 的 Lync 对话文件？ 的相关文章

随机推荐

热门标签

如何读取包含 HTML 的 Lync 对话文件？的相关文章