C# 提取PPT文本和图片
在图文混排的文档中,我们可以根据需要将文档中的文字信息或者图片提取出来,通过C#代码可以提取Word和PDF文件中的文本和图片,那么同样的,我们也可以提取PPT幻灯片当中的文本和图片。本篇文档将讲述如何使用C#来实现提取PPT文本和图片的操作。首先也是需要安装组件Spire.Presentation,然后添加引用dll文件到项目中。下面是主要的代码步骤。
原文档:
1. 提取文本
步骤一:创建一个Presentation实例并加载文档
Presentationpresentation=newPresentation(@"C:\Users\Administrator\Desktop\sample.pptx",FileFormat.Pptx2010);
步骤二:创建一个StringBuilder对象
StringBuildersb=newStringBuilder();
步骤三:遍历幻灯片及幻灯片中的图形,提取文本内容
foreach(ISlideslideinpresentation.Slides){foreach(IShapeshapeinslide.Shapes){if(shapeisIAutoShape){foreach(TextParagraphtpin(shapeasIAutoShape).TextFrame.Paragraphs){sb.Append(tp.Text+Environment.NewLine);}}}}
步骤四:写入Txt文档
File.WriteAllText("target.txt",sb.ToString());Process.Start("target.txt");
2. 提取图片
这里提取图片有两种情况,一种是提取整个文档中的所有图片,另外一种是只提取文档中某一特定幻灯片中的图片。
2.1提取所有图片
步骤一:初始化一个Presentation类实例,并加载文档
Presentationppt=newPresentation();ppt.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");
步骤二:遍历文档中图片,提取图片并保存
for(inti=0;i<ppt.Images.Count;i++){Imageimage=ppt.Images[i].Image;image.Save(string.Format(@"..\..\Images{0}.png",i));}
提取的图片已保存到项目文件夹下
2.2.提取特定幻灯片中的图片
步骤一:创建一个Presentation类实例,并加载文档
PresentationPPT=newPresentation();PPT.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");
步骤二:获取第三张幻灯片,提取并保存图片
inti=0;foreach(IShapesinPPT.Slides[2].Shapes){if(sisSlidePicture){SlidePictureps=sasSlidePicture;ps.PictureFill.Picture.EmbedImage.Image.Save(string.Format("{0}.png",i));i++;}if(sisPictureShape){PictureShapeps=sasPictureShape;ps.EmbedImage.Image.Save(string.Format("{0}.png",i));i++;}}
提取的第三张幻灯片中的图片已保存至指定位置
上文演示了如何提取文本和图片,步骤比较简单实用,希望对你有所帮助,感谢阅读!
(如需转载,请注明出处和作者)
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。