问题标签 [checkpoint]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
firewall - 使用 OPSEC API 收集 CheckPoint 防火墙规则
我需要使用 OPSEC API 远程收集属于我的客户端的防火墙规则数据。我在网上研究了一下,发现我可以使用 OPSEC API 的 LEA(日志导出 API)(更多信息:https ://www.fir3net.com/Firewalls/Check-Point/a-quick-guide-to -checkpoints-opsec-lea.html)。我还发现有一个名为 fw1-lograbber 的项目(https://github.com/certego/fw1-loggrabber)。我对网络安全很陌生,实际上对 CheckPoint 防火墙一无所知。所以我的问题是对 CheckPoint 防火墙规则的基础知识以及如何使用 OPSEC API 收集它们的简要说明。更具体地说,检查点日志中是否包含规则,或者 LEA 中是否有特定方法来获取规则?
谢谢你们!
qemu - qemu 模拟器有检查点功能吗?
我正在为 aarch64 使用 qemu 模拟器,并希望创建一个外部检查点(或快速转发)以保存从创建检查点时重新启动系统所需的所有内容。(其实我是想跳过开机步骤)我只在qemu VM快照和快进上发现了一些东西,但对模拟器不起作用。qemu 模拟器有检查点功能吗?
docker - 错误:检查点一个或多个容器失败
我使用 docker-1.10.0-dev 来检查 docker 容器。但是出现了一个问题。
我在http://criu.org/Docker上下载了这个 docker
linux - 如何编写 shell 脚本来检查 ubuntu 中正在运行的进程?
不能使用 CRIU 或任何其他检查点/恢复命令。我需要能够在不同的系统上恢复进程。
tensorflow - 如何从张量流中的检查点继续训练初始模型
我已经加载了预训练的初始模型:
if FLAGS.pretrained_model_checkpoint_path:
assert tf.gfile.Exists(FLAGS.pretrained_model_checkpoint_path)
variables_to_restore = tf.get_collection(
slim.variables.VARIABLES_TO_RESTORE)
restorer = tf.train.Saver(variables_to_restore)
restorer.restore(sess, FLAGS.pretrained_model_checkpoint_path)
print('%s: Pre-trained model restored from %s' %
(datetime.now(), FLAGS.pretrained_model_checkpoint_path))
并通过使用flowers_train.py
在我的数据上训练模型
训练完成后,损失约为1.0,模型保存在指定目录。
现在我想继续训练,所以,我恢复模型:
if FLAGS.checkpoint_dir is not None:
# restoring from the checkpoint file
ckpt = tf.train.get_checkpoint_state(FLAGS.checkpoint_dir)
tf.train.Saver().restore(sess, ckpt.model_checkpoint_path)
并继续训练模型,但第一步的损失约为 6.5,这实际上意味着该模型根本没有初始化。
这是inception_train.py的全部内容,这些内容是从这个inception_train.py修改而来的
我乘坐的第一列火车是:
bazel-bin/inception/flowers_train --train_dir="{$TRAIN_DIR}" --data_dir="{$DATA_DIR}" --fine_tune=True --initial_learning_rate=0.001 --input_queue_memory_factor=1 --batch_size=64 --max_steps=100 --pretrained_model_checkpoint_path="/home/tensorflow/inception-v3/model.ckpt-157585"
我试图通过这个命令继续训练:
bazel-bin/inception/flowers_train --train_dir="{$TRAIN_NEW_DIR}" --data_dir="{$DATA_DIR}" --fine_tune=False --initial_learning_rate=0.001 --input_queue_memory_factor=1 --batch_size=64 --max_steps=2000 --checkpoint_dir="{$TRAIN_DIR}"
拜托,谁能解释一下,初始化训练模型时我做错了什么?
scala - 为什么在火花流中使用 mapWithState/checkpoint 时会在处理时间图中看到周期性脉冲?
我编写了一个 stateful-wordCount spark 流应用程序,它可以连续接收来自 Kafka 的数据。我的代码包含一个mapWithState
函数并且可以正常运行。当我在 spark UI 检查 Streaming Statistics 时,我在处理时间图表中发现了一些周期性脉冲。我认为这可能是由于使用checkpoint引起的。希望有人能解释一下,非常感谢!
和完成的批次表:
我发现一些 1 秒时间成本的批次会定期发生。然后我进入一个 1 秒时间成本批次和一个亚秒时间成本批次,发现 1 秒时间成本批次比另一个多工作。
这似乎是由 引起的checkpoint
,但我不确定。
谁能给我详细解释一下?谢谢!
这是我的代码:
tensorflow - TensorFlow 检查点模型被删除
我使用以下代码在每 10 个时期后使用 tensorflow 检查点:
问题是,随着新文件的生成,之前的 5 个模型文件会被自动删除。
tensorflow - Tensorflow:成功恢复检查点后丢失重置
保存或恢复时没有错误。重量似乎已正确恢复。
我正在尝试按照karpathy/min-char-rnn.py、sherjilozair/char-rnn-tensorflow和Tensorflow RNN 教程来构建我自己的最小字符级别 RNN 。我的脚本似乎按预期工作,除非我尝试恢复/恢复训练。
如果我重新启动脚本并从检查点恢复,然后恢复训练,则损失总是会恢复,就好像没有检查点一样(尽管权重已正确恢复)。但是,在脚本的执行过程中,如果我重置图表、启动新会话并恢复,那么我可以继续按预期将损失最小化。
我试图在我的台式机(带有 GPU)和笔记本电脑(仅 CPU)上运行它,两者都在带有 Tensorflow 0.12 的 Windows 上。
下面是我的代码,我在这里上传了代码+数据+控制台输出: https ://gist.github.com/dk1027/777c3da7ba1ff7739b5f5e89491bef73
docker - 使用 CRIU 的 Wildfly Docker 容器实时迁移失败
我正在尝试将 wildfly docker 容器实时迁移到此处描述的另一个主机。np-example 运行良好。
这是我的容器
但是当我尝试检查它时,我得到了这个错误
即使是挂起的 Wildfly 服务器和没有端口转发和卷共享的容器也无法设置检查点。
谁能告诉我如何找到一个日志文件来指定错误。
提前致谢
php - postgresql 查询在 VPN 上无限期挂起 - 新防火墙
我们有一个产品,其中本地 linux 机器“SCANNER”在本地网络上进行一些轮询,然后使用 pg_query(服务器运行 PostgreSQL 9.5.5)通过 OpenVPN 连接将信息填充到我们云服务器中的数据库中。
SCANNER 上有一个 PHP (5.5.9) 守护程序,它在“while”循环中检查数据库以完成工作。这一直很有效,并且继续在我们所有的客户网络上运行良好,除了一个最近出现了一个奇怪的问题。
在他们升级了防火墙(一个 Checkpoint 5200,据我们所知,所有规则都是正确的,允许通过 VPN 从 SCANNER 到我们的云服务器的流量),一个脚本中的一个查询无限期挂起。以下是我们注意到的症状:
大多数情况下,查询工作正常,脚本继续。每隔一段时间,pg_query() 调用就会阻塞并且永远不会返回。并不是说有错误;该调用实际上会永远阻塞(或者在我们手动重新启动之前的几个小时)。
这个查询很长一段时间都是一样的,在我们的任何其他客户端上,我们从来没有遇到过这个问题,也没有在这个客户端上遇到过这个问题,直到他们改变了他们的防火墙。
我们可以通过查看云服务器上的 pg_stat_activity 表来判断该查询确实到达了云,然后永远位于该表中。在每种情况下,pg_stat_activity.state='idle' 和 pg_stat_activity.waiting=false
在此期间,我们仍然可以通过 VPN 从 SCANNER ping 云服务器,并且可以继续从 SCANNER 上的其他脚本和 SCANNER 的命令行成功查询其远程数据库。
这个客户端碰巧有两台不同的 SCANNER 机器,在不同的子网上但在同一个防火墙后面。此问题可能随时出现在任何一个上,但不一定同时出现在两个上(至少没有任何统计意义)。
如果我们重新启动守护进程,问题就暂时解决了。但它通常会在 2 秒到几个小时后的某个时间再次出现。
我们正在寻找任何可能解决问题的输入,无论是与我们的应用程序还是防火墙本身(我们已获得根据需要进行修改的权限)相关。随时提出任何澄清问题。
提前致谢!