使用 nbconvert 作为库运行预处理器

2024-03-18

我想使用预处理器运行 nbconvert，该预处理器会删除标有“skip”标签的单元格。我可以从命令行执行此操作，但是当我尝试在笔记本中使用 nbconvert API 时，我遇到了问题。

一个例子

按照中的示例文档 https://nbconvert.readthedocs.io/en/latest/nbconvert_library.html#Quick-overview，我拿了一个笔记本来工作。

from urllib.request import urlopen

url = 'http://jakevdp.github.com/downloads/notebooks/XKCD_plots.ipynb'
response = urlopen(url).read().decode()

import nbformat
nb = nbformat.reads(response, as_version=4)

我将修改一个单元格，以便在输出中跳过它。

nb.cells[1].metadata = {'tags': ['skip']}

命令行

保存文件，然后从命令行运行 nbconvert：

nbformat.write(nb, 'nb.ipynb')

%%bash
jupyter nbconvert --to latex \
--TagRemovePreprocessor.remove_cell_tags='{"skip"}' \
--TagRemovePreprocessor.enabled=True \
'nb.ipynb'

这有效。输出nb.tex文件不包含标记为“skip”的单元格。

API

现在让我们使用 API 来尝试一下。首先，不进行任何预处理：

import nbconvert
latex, _ = LatexExporter().from_notebook_node(nb)
print(latex[:25])

\documentclass[11pt]{arti

再说一遍，没问题。转换正在进行中。

现在，尝试使用我在命令行中使用的相同预处理器：

from traitlets.config import Config

c = Config()
c.RemovePreprocessor.remove_cell_tags = ('skip',)
c.LatexExporter.preprocessors = ['TagRemovePreprocessor']

LatexExporter(config=c).from_notebook_node(nb)

这次，我得到：

ModuleNotFoundError：没有名为“TagRemovePreprocessor”的模块

据我所知，这段代码与文档中的代码示例 https://nbconvert.readthedocs.io/en/latest/removing_cells.html#removing-pieces-of-cells-using-cell-tags，除了我使用的是 Latex 导出器而不是 HTML。那么为什么它不起作用呢？

对于您的具体情况，我相信您可以通过更改来解决问题：c.RemovePreprocessor.remove_cell_tags = ('skip',) -> c.TagRemovePreprocessor.remove_cell_tags = ('skip',)

为了像我一样通过搜索遇到此线程的其他人的利益

ModuleNotFoundError: No module named 'TagRemovePreprocessor'

有一个开放问题 https://github.com/jupyter/nbconvert/issues/764 with TagRemovePreprocessor这导致除HTMLExporter (and LatexExporter？）自动禁用此预处理器。

就我而言，我试图使用NotebookExporter并且需要显式启用预处理器并更改预处理级别，如下所示：

import json
from traitlets.config import Config
from nbconvert import NotebookExporter
import nbformat

c = Config()
c.TagRemovePreprocessor.enabled=True # Add line to enable the preprocessor
c.TagRemovePreprocessor.remove_cell_tags = ["del_cell"]
c.preprocessors = ['TagRemovePreprocessor'] # Was previously: c.NotebookExporter.preprocessors

nb_body, resources = NotebookExporter(config=c).from_filename('notebook.ipynb')
nbformat.write(nbformat.from_dict(json.loads(nb_body)),'stripped_notebook.ipynb',4)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

jupyternotebook

nbconvert

使用 nbconvert 作为库运行预处理器的相关文章

运行 IPython 笔记本时如何（间歇性地）跳过某些单元格？

重新打开笔记本时我通常必须重新运行笔记本的大部分部分以便访问先前定义的变量并继续工作然而有时我想跳过一些单元格这些单元格对后续单元格没有影响例如它们可能包含已完成的分析分支并且可能需要很长时间才能运行这些单元格可能分散在
如何在 jupyter 笔记本中导入 scikit-learn？

我创建了一个新的 conda 环境来使用 scikit learn 并使用conda install
如何获取 Jupyter Notebook 的“markdown”单元格中的制表符空间

我正在编写描述性 ipynb 文件需要在带有空格的 markdown 中给出输出但无法添加制表符空间来打印结构化数据键入 nbsp 以添加一个空格输入 ensp 添加 2 个空格输入 emsp 添加 4 个空格使用不间断空格 n
保存 Jupyter Notebook，并显示 Plotly Express 小部件

我有一个 Jupyter 笔记本 python 我使用plotlyexpress 在笔记本中绘图以进行分析我想与非编码人员共享此笔记本并让交互式视觉效果仍然可用但它似乎不起作用我尝试以下此处提出的建议 https community
VSCode Jupyter Notebook - 恢复缓存版本

我正在使用在 Ubuntu 19 10 上运行的 VSCode v 1 48 0 创建一个 Jupyter Notebook VSCode 崩溃了不幸的是我没有保存笔记本当我重新启动时它是空的我已经能够在 config Code Us
如何为 pandas 列的每组创建子图

在泰坦尼克号数据集中我需要创建一个图表来显示所有舱位幸存者的乘客百分比它还应该有三个饼图 1 级幸存和未幸存 2 级幸存和未幸存 3 级如何才能实现这一点呢我已经尝试过这种类型的代码但它会产生错误的值 import pandas
默认情况下隐藏 JupyterLab 单元的输出

我在用Jupyter实验室构建使用 bash 和 python 脚本的生物信息学管道第一个 bash 脚本结果为该过程的每一步提供了大量反馈但是此反馈没有帮助除非出现错误并且使文档的可读性较差我希望能够默认隐藏该单元格的输出而
Jupyter笔记本情节不显示图表..（仅图表）[重复]

这个问题在这里已经有答案了在 jupyter 笔记本中我的代码确实运行只是不显示图形我尝试过很多方法我的示例代码图片我的代码和图片 import plotly offline as pyo import plotly grap
如何在MacOS中的jupyter笔记本中显示所有可能的方法？

我发现了类似的问题但没有一个与我的问题相关MacOS 在 Jupyter Notebook 上显示所有可能的方法 https stackoverflow com questions 54636383 showing all possibl
更改 IPython 笔记本小部件中标签的大小

这确实是一个小问题但仍然很烦人我正在编写一个工具允许用户设置一堆数字参数以在 IPython 笔记本中进行分析我把它设置为一堆FloatTextWidgets in a ContainerWidget 它们有相当长的标签例如姿势
ipython/jupyter 中的 tk 问题

我正在尝试编写一个用于从 ipython jupyter 笔记本启动的 gui 但在笔记本中使用 tkinter 时遇到了麻烦特别是在让 tk gui 窗口正常关闭方面如何从 jupyter 制作启动 tkinter gui 然后在不
加载 IPython 笔记本时出错

一旦我用 Jupyter 打开笔记本文件它要求我转换文件我就再也无法在标准 IPython 笔记本中打开它了我收到以下错误 Error loading notebook Bad Request 2014 12 21 04 13 03
为什么 matplotlib 默认不保存整个图形？

这可能是几乎每个使用 matplotlib 的人都会遇到的问题如果您生成一个图形通常包含轴标签和图例并使用默认设置保存它您将获得裁剪后的图像演示代码 import matplotlib pyplot as plt def plot
通过新数据更新绘图，而不是在 Jupyter 笔记本中制作新绘图

我有一些问题希望你能帮我解决我需要使用下拉小部件创建交互式绘图我可以在其中选择并绘制感兴趣的数据我通过以下方式做到这一点 import plotly graph objects as go import ipywidgets as
在不同的 GPU 上同时训练多个 keras/tensorflow 模型

我想在 Jupyter Notebook 中同时在多个 GPU 上训练多个模型我正在使用 4GPU 的节点上工作我想将一个 GPU 分配给一个模型并同时训练 4 个不同的模型现在我通过例如为一台笔记本选择 GPU import
Jupyter Notebook：搜索文本并转到单元格。

选择所有单元格时 F键盘快捷键打开查找和替换界面我可以在其中查看搜索表达式的所有单元格并可能替换该表达式但是我还没有找到进入这些牢房的方法这是特别有问题的因为我的浏览器在使用折叠标题扩展时没有检测到这些单元格查找和替换界
ipython 笔记本锚链接直接从外部引用单元格

我正在为基于笔记本的框架编写文档当引用演示笔记本中的重要单元格时我可以使用某种锚点来指向特定单元格吗例如如果我的演示笔记本位于 127 0 0 1 mydemo 是否可以通过某些锚标记如 127 0 0 1 mydemo In10
Python - UnicodeDecodeError：“charmap”编解码器无法解码位置 44 中的字节 0x81：字符映射到 <未定义>

在 Python 3 Jupyter 笔记本上使用 pandas 我得到了 UnicodeDecodeError charmap 编解码器无法解码字节 0x81 位置 44 字符映射到尝试读取如下所示的 json 文件时出错 Test1
在 jupyter 笔记本中内联显示 R ggplots

我正在尝试运行这里找到的一个简单示例 https www datacamp com community blog jupyter notebook r gs OczVCjA https www datacamp com community
在同一个 jupyter 单元中运行多个命令

我试图同时显示 2 行的 2 个输出我使用 Panda 库它似乎只显示第二行的输出 import pandas as pd data state Ohio Ohio Ohio Nevada Nevada year 2000 2001 2

随机推荐

Python：无法将浮点 NaN 转换为整数

我应用返回浮动的移动平均逻辑我先将该 float 转换为 int 然后再使用它在 OpenCV 中绘制线条但出现以下错误 ValueError cannot convert float NaN to integer 示例代码 def m
API 设计：公开 XML 或对象 #2

我最近问了这个问题公开 XML 或对象 https stackoverflow com questions 368521 api design expose xml or objects 感谢大家的回复有一点需要澄清 API 始终可以远
如何在 PostgreSQL 中以事务方式插入 max(order_field) + 1 行

我需要在 PostgreSQL 表中插入一行其中有一列包含表行子集上同一列的最大值 1 该列用于对该子集中的行进行排序我正在尝试更新插入后触发器中的列值但我在不同行中获取该列的重复值在短时间内进行大量插入的并发环境中避免子集中排序
如何从 SSL 证书中提取密钥？

我有一个在以下网站购买的 SSL 证书 pem crt der格式我想知道如何从证书中获取密钥文件有什么办法可以做到这一点吗您可以提取公钥这的用处有限也许您将在其他不使用证书的工具例如 SSH 或 PGP 中使用相同的密钥使用
JTable 的 ScrollPane 行为异常

我有一个JPanel组件与JTable在它里面当我运行下面编写的代码时表格会正确呈现和更新一旦我尝试使用scrollPane方法该表根本不呈现谁能向我解释这是为什么 private static class GameHistory
Java中有没有内置的方法来增加字体大小？

Java中有没有内置的方法来增加字体大小 The Font http java sun com javase 6 docs api java awt Font html类允许您指定字体大小因此要创建字体您可以执行以下操作 Font f
当行突出显示时设置 cellrenderertext 前景色

当我有一个gtk CellRendererText 我可以关联它的foreground用树存储的一列着色并设置foreground set属性设置为 True 以更改该列中文本的颜色但是当选择具有彩色列的行时其颜色会消失并且与任何
getContext().getSystemService 错误

所以我只是想在我的 getView 函数中膨胀一个视图而 getContext 由于某种原因说它是未定义的 package com MTSUAndroid import com MTSUAndroid Alarm Settings Eff
是否有类似于 C sscanf 的 VB6 函数？

我正在尝试读取由以下形式的文本行组成的文件 first value 1352 2 second value 12 third value 32323 first value 1233 2 second value 22 third valu
关闭 Numba 中的列表反射

我正在尝试使用 Numba 加速我的代码我传递给函数的参数之一是可变列表列表当我尝试更改子列表之一时出现此错误在 nopython 模式管道中失败步骤 nopython 模式后端无法反映反射容器的元素反射列表反射列表 int
在 TFS API 中，如何获取给定测试的完整类名？

我有一个ITestCaseResult http msdn microsoft com en us library microsoft teamfoundation testmanagement client itestcaseresult
postgresql 多个子查询

我手头有一项任务要求我返回一个学生的详细信息该学生参加了一位姓霍夫曼的老师所教的课程但我陷入了困境 SELECT FROM Public Class WHERE tid SELECT tid FROM Public Tutor WHE
在 MVC Web 应用程序中访问 profile.newproperty

我最近问了这个问题如何保留匿名用户选择例如主题选择 https stackoverflow com questions 11706349 how to persist anon user selection ex theme selec
将解析信息添加到 Robolectric 包管理器

这个问题与我想做的非常相似如何使用 Robolectric 隐藏 PackageManager https stackoverflow com questions 12902777 how can i shadow the package
$.when 不等待 Ajax 请求完成

我想首先使用 Backbone js 渲染一个视图该视图显示从服务器拉取的文章然后我想将其标记为已见并将未见消息的计数返回给路由器因为它需要可供其他视图使用所以在我的路由器中我有 getArticle function id
使用javascript在IE中设置cookie

document cookie cookiename cookievalue 过期星期一 12Jun2015 00 00 00 路径我在 Internet Explorer 10 上运行此脚本但它不在 2 个 IE 选项卡之间共享 c
Unity 2D Trail 渲染器碰撞

我制作 2D unity 游戏但我面临着我的游戏所依赖的一个主要问题我将一个轨迹渲染器组件附加到我的播放器上我需要的是使渲染器成为一个碰撞器充当网格碰撞器我只是不知道是否可以使碰撞器呈现 2D 轨迹渲染器的形状我在谷歌上搜索过但
将 StackExchange.Redis 客户端与 Redis 集群结合使用

如何告诉 StackExchange Redis v1 0 481 它即将连接到 Redis 集群 v3 2 6 如果重要的话而不仅仅是独立复制实例例如当我使用 redis cli 时我必须传递 c 标志以使其具有集群感知能力 S
尝试修复 tkinter GUI 冻结问题（使用线程）

我有一个 Python 3 x 报告创建器它的 I O 限制非常大由于 SQL 而不是 Python 以至于主窗口将锁定 minutes在创建报告时所需要的只是能够在 GUI 锁定时使用标准窗口操作移动调整大小最小化关闭等
使用 nbconvert 作为库运行预处理器

我想使用预处理器运行 nbconvert 该预处理器会删除标有 skip 标签的单元格我可以从命令行执行此操作但是当我尝试在笔记本中使用 nbconvert API 时我遇到了问题一个例子按照中的示例文档 https nbconv

使用 nbconvert 作为库运行预处理器

一个例子

命令行

API

使用 nbconvert 作为库运行预处理器 的相关文章

随机推荐

热门标签

使用 nbconvert 作为库运行预处理器的相关文章