我是深度学习领域的新手。我想在 Google Colab 中运行对象检测模型时使用 TensorBoard。
我已经提到了几个讨论线程(How to run eval.py job for tensorflow object detection models)
但没有得到我的具体查询的答案。
我在下面给出了我遵循的步骤:
过程 1:
1.下载ngrok并解压
!wget https://bin.equinox.io/c/4VmDzA7iaHb/ngrok-stable-linux-amd64.zip
!unzip -o ngrok-stable-linux-amd64.zip
2.指定日志目录并在后台启动tensorboard:
LOG_DIR = '/content/models/research/training'
get_ipython().system_raw(
'tensorboard --logdir {} --host 0.0.0.0 --port 6006 &'
.format(LOG_DIR)
)
3.Ran ngrok 通过端口 6006 隧道 TensorBoard:
get_ipython().system_raw('./ngrok http 6006 &')
生成的 TensorBoard 链接:
! curl -s http://localhost:4040/api/tunnels | python3-c\ “导入 sys、json;打印(json.load(sys.stdin)['隧道'][0]['public_url'])”
问题:
我。当我打开链接时,打开了一个带有通知的空白页面:
*No dashboards are active for the current data set.
Probable causes:
You haven’t written any data to your event files.
TensorBoard can’t find your event files.*
二。在训练的过程中,我回去刷新tensorboard,它看起来是一片空白
此外,在任何给定实例中,我的日志目录(即训练目录)都有以下文件:日志文件在哪里?
我的问题:
如何在 TensorBoard 中查看训练进度?我遵循的方法有什么问题吗?
过程 2:
正如@cookiemonster 所建议的那样:
我尝试了以下设置以从 Colab 单元本身打开 TensorBoard:
!pip install tb-nightly
%load_ext tensorboard
%tensorboard --logdir '/content/models/research/training'
输出:
刚来一个橙条
如何在训练过程中查看训练过程中的训练状态。
最后一个问题:
我的主要目标是通过更改配置文件中“matrics_set”的值来检查不同的评估矩阵,然后通过运行 eval.py 我需要检查结果。
我在一个线程中读到“结果输出到以 events.out.tfevents 为前缀的事件摘要文件,您可以使用 TensorBoard 对其进行可视化”
(引用:Run object detection evaluation protocols (tensorflow))
我的问题:
如果我只运行以下代码,日志文件会在我指定的日志目录中生成吗?
!python eval.py --logtostderr --pipeline_config_path=<path to training directory>/faster_rcnn_inception_v2_pets.config --checkpoint_dir=<path to training directory> --eval_dir=<path to log directory>
鉴于目前我在查看 tensorboard 时遇到的基本问题,我如何才能实现查看运行 eval.py 结果的主要目标?
最佳答案
仅供引用,新的张量板可以直接在笔记本中运行,所以你可以运行
!pip install tb-nightly
%load_ext tensorboard
%tensorboard --logdir "/content/runs"
或者您挂载 google drive 并可以在另一个 colab notebook 中运行它(可能只使用 CPU)以避免弄乱已安装的库
%tensorboard --logdir "/content/drive/My Drive/Colab Runs"
关于python - 设置 TensorBoard 以在 Google Colab 中为 TensorFlow 对象检测模型运行 eval.py 作业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57431010/
相关文章:
react-native - 使用 wix react native navigation v3 设
python - matplotlib/seaborn : first and last row c
msbuild - 旧项目格式忽略 PackageReference 条件
python - 如何将文件传递给 unittest.mock.mock_open()?
python - 在 Tensorflow 2.0 中卡住和导出 TensorFlow 模型
reactjs - Next.js 状态改变不重新渲染 UI