1. Jupyter基础

JUPYTER是一款开源的交互式计算环境 , 为数据科学家、研究人员和开发者提供了一个灵活且强大的平台 , 用于创建、共享和展示计算性工作。它最初由Fernando Perez2014年推出 , 并得到了全球广泛的应用和认可。JUPYTER的名称源自三个核心编程语言 : JuliaPythonR。它支持超过40种编程语言 , 并通过所谓的"Notebook"界面提供了一个交互性的环境 , 其中代码、图表和文档可以在同一个界面中组合并共享。这使得JUPYTER成为探索、可视化和解释数据的理想工具。此外 , JUPYTER还提供了丰富的插件和扩展功能 , 以满足不同用户的需求。

要使用JUPYTER , 首先需要安装它。您可以通过以下步骤进行安装 :

  1. 打开终端或命令提示符。

  2. 使用pip包管理工具执行以下命令 : pip install jupyter

  3. 等待安装完成后 , 可以输入jupyter notebook启动JUPYTER。这里通过在本地开启一个随机端口,在默认浏览器中打开端口的Jupyter Notebook应用程序。

    这里可以通过命令jupyter notebook --port <port_number> 来指定生成的端口

由于每次启动jupyter notebook 的存储路径都是保存至当前目录。通过以下方式设置默认的存储路径位置

首先需要使用命令生成jupyter notebook 的配置文件, 生成的配置文件位置:C:\Users\<username>\.jupyter\jupyter_notebook_config.py

jupyter notebook --generate-config

修改配置文件的如下图所示位置

c.ServerApp.root_dir = 'D:\Python\Jupyter'

image-20250810002313446

之后直接在命令行启动即可

2. Jupyter核心组件

Jupyter Notebook

Jupyter NotebookJupyter项目中最著名的组件 , 它是一个开源的Web应用程序 , 允许用户创建和分享包含实时代码、方程、可视化以及叙述性文本的文档。Notebook文件有一个.ipynb的扩展名 , 可以轻松地在不同用户之间共享 , 支持多种编程语言。

  • 特点 : 提供了一个富文本编辑器 , 支持MarkdownHTMLLaTeXSVG等格式。它使得数据清洗、转换、数值模拟、统计建模、数据可视化以及机器学习等任务变得更加直观和交互式。

  • 应用 : 广泛应用于数据科学、科学计算、机器学习教育和研究等领域。

JupyterLab

JupyterLabJupyter项目的下一代Web前端用户界面, 提供了基于Web的可扩展环境 , 用户可以在其中处理笔记本、代码、数据和文本文件。JupyterLab旨在提供一个统一的环境 , 其中包含Jupyter Notebook的所有核心功能 , 并添加了更多的改进和增强功能。

  • 特点 : 具有模块化和可扩展的架构 , 支持多个Notebook和其他文档 ( 如Markdown文档、图像等 ) 并排显示 , 提供了内置的文件浏览器、富文本编辑器、终端以及自定义组件等。

  • 应用 : 适用于需要更复杂数据分析和研究工作流程的用户 , 提供了更强大的工具和界面来探索和分析数据。

IPython核心

IPythonJupyter项目的核心 , 最初是作为Python的一个增强的交互式解释器启动的 , 现在已经成为支持交互式计算的强大工具。IPython提供了一个丰富的工具集 , 用于交互式计算 , 包括 : 一个强大的交互式Shell、一个架构化的历史记录、用于交互式数据可视化的集成绘图功能、以及对并行计算的支持。

  • 特点 : 通过提供高级自动补全、探索和可视化功能 , 改善了用户的交互式编程体验。

  • 应用 : 作为Jupyter NotebookJupyterLab的底层计算引擎 , IPython核心使这些工具能够执行Python代码

3. 基本使用

启动jupyter notebook成功之后是这样的 , Files页面是用于管理和创建文件相关的类目,可以在右侧的New下拉菜单中选择创建Python文件

image-20250810003452565

Jupyter中创建的文件默认扩展名是: .ipynb,可以新建Python3文件或者打开原来创建的文件,打开之后如下

image-20250810003831365

一般新建的文档都会以Untitled+数字进行命名 , 比如Untitled1Untitled2....,可以通过点击左上方的名字进行重命名

image-20250810004007159

默认juypter可以通过tab键进行代码的提示 , 如果想使用Pycharm一样的自动提示 , 可以添加代码自动补全的扩展。

image-20250810004152149

常用的快捷键是:

  • Ctrl + Enter: 执行单元格代码

  • Shift + Enter: 执行单元格代码并且移动到下一个单元格

  • Alt + Enter: 执行单元格代码 , 新建并移动到下一个单元格

  • a : 之前插入代码块、

  • b : 之后插入代码块

  • L : 增加行号

历史输入和输出变量

当你写的单元格多了 , 肯定会注意到 , IPython 中每一次的输入输出都有序号。你可以通过一下方法访问这些输入和输出:

  • _:访问上一次输出

  • __:访问上上一次输出

  • _X:访问历史 X 行输出

  • _iX:访问历史 X 行输入

其中小写字母 "i", 代表" in"。

魔术命令

IPython 的会话环境中 , 所有文件都可以通过 %run 命令来当做脚本执行 , 并且文件中的变量也会随即导入当前命名空间。

即对于一个模块文件 , 你对他使用 %run 命令的效果和 from module import * 相同

这种以 % 开头的命令在 IPython 中被称为魔术命令 , 用于加强 shell 的功能。

常用的魔术命令有:

2950821-20230425123435231-1756969742

对魔术命令不熟悉的话可以通过 %magic 查看详细文档

image-20250810005058129


参考链接

Jupyter的全面探索:从入门到高级应用 , 安装最常见的是使用Python的包管理器pip或Anaconda发行版 - sunny123456 - 博客园

jupyter安装使用详解 - 可爱的小锋 - 博客园


熊熊