0

希望 Acumos Boreas OneClick(和其他安装脚本)现在可以实际工作......

我正在尝试代表AI4EU 项目 (任务 3.2)再次在 Ubuntu 18.04 服务器上安装 Acumos Boreas 版本。不幸的是,我的希望正在减少……

我在此处遵循第 2.1.2 节中的程序: https ://docs.acumos.org/en/boreas/submodules/system-integration/docs/oneclick-deploy/user-guide.html#host-vm-preparation

我从一个全新的 Ubuntu 18.04 虚拟机开始(使用 32G 内存、12 个内核和 300 GB 磁盘创建)。

这样做(并在出现提示时输入 sudo 密码):

git clone https://gerrit.acumos.org/r/system-integration
cd system-integration/tools/
bash setup_docker.sh
if [[ "$(id -nG "$USER" | grep docker)" == "" ]]; then sudo usermod -aG docker $USER; fi
# Logged out and in again and verified that my user is in the docker group
cd system-integration/tools/
bash setup_k8s_stack.sh setup
cd
bash system-integration/AIO/setup_prereqs.sh k8s acumos.tele.no $USER generic 2>&1 | tee aio_prep.log
# When "Prerequisites setup is complete" messages is displayed I continue with
cd system-integration/AIO
bash oneclick_deploy.sh 2>&1 | tee aio_deploy.log

部署失败并显示以下错误消息:

....
oneclick_deploy.sh setup_federation:233 (Tue Aug 20 13:47:04 UTC 2019) CDS API is not yet ready; waiting 10 seconds
+ t=300
+ sleep 10
++ curl -k -u ccds_client:27f928e9-cdde-4483-b3c9-7da074972908 https://acumos.tele.no/ccds/peer
++ grep -c numberOfElements
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100   203  100   203    0     0   7000      0 --:--:-- --:--:-- --:--:--  7000
+ [[ 0 -eq 0 ]]
+ [[ 300 -eq 300 ]]
+ fail 'CDS API is not ready after 300 seconds'
+ set +x

当我使用 Kubernetes Dashboard 查看实际失败的原因时,我确实看到 common-dataservice pod 失败了。

我还可以看到 docker_proxy 和其他一些 pod 显然经常崩溃。

所有安装和错误日志都可以在这里找到: https ://www.dropbox.com/sh/61snwd26zbixwl3/AAAWcfBKnIwNkRghXSMQayrEa?dl=0

如果有人能够指导我如何为 AI4EU 项目 (WP3) 安装 Acumos Boreas 以进行探索,将不胜感激。

4

1 回答 1

0

Arne,请确保您可以从正在运行的 CDS 容器中连接到主机“acumos”。如果这是一个云服务 VM,您可能必须打开一个安全组规则以允许 VM 在其公共 IP 上连接到自身(听起来很隐含,但并不总是默认设置)。您可以通过以下方式进行测试

kubectl exec -it -n acumos $(kubectl get pods -n acumos -l app=sv-scanning | awk '/sv-scanning/{print $1}') -- curl http://acumos:30001

注意:这个命令示例使用 sv-scanning 容器,因为它安装了 curl……但是,测试是查看是否有任何容器可以连接到 MariaDB。默认情况下,如果 Acumos 域不是 DNS 可解析的(如 /etc/hosts 文件中的条目所示),则会将 hostAlias 添加到每个部署模板中。

(更新)我添加了一个脚本来创建一个调试容器(基于 ubuntu)并将其作为命名空间下的 pod 运行。这样你就可以添加任何你想调试的工具,例如我已经安装了 curl、j1、netcat。使用该容器验证与http://acumos:30001的连接,查看 CDS 日志等。

#!/bin/bash
kubectl delete deployment -n acumos debug
while [[ "$(kubectl get pods -n acumos -l app=debug)" != "" ]] ; do
  echo 'waiting...'; sleep 10
done
cat <<EOF >debug.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  namespace: acumos
  name: debug
spec:
  selector:
    matchLabels:
      app: debug
  replicas: 1
  template:
    metadata:
      labels:
        app: debug
    spec:
      containers:
      - name: debug
        image: ubuntu
        command: ['/bin/bash', '-c']
        args:
        - apt-get update; apt-get install -y curl jq netcat;
          sleep 3600;
        volumeMounts:
        - mountPath: /logs
          name: logs
      restartPolicy: Always
      volumes:
      - name: logs
        persistentVolumeClaim:
         claimName: logs
EOF
kubectl create -f debug.yaml
# Wait till running
while [[ $(kubectl get pods -n acumos -o yaml -l app=debug | grep -c 'phase: Running') -eq 0 ]]; do
  echo 'waiting...'; sleep 10
done
kubectl exec -it -n acumos $(kubectl get pods -n acumos -l app=debug -o name | sed 's/pod\///') -- bash
于 2019-08-26T14:22:17.887 回答