最佳实践 | Azure Log Analytics Agent 排错答题思路

时间:2021-07-15 | 标签: | 作者:Q8 | 来源:徐庭网络

小提示:您能找到这篇{最佳实践 | Azure Log Analytics Agent 排错答题思路}绝对不是偶然,我们能帮您找到潜在客户,解决您的困扰。如果您对本页介绍的最佳实践 | Azure Log Analytics Agent 排错答题思路内容感兴趣,有相关需求意向欢迎拨打我们的服务热线,或留言咨询,我们将第一时间联系您!

< ">云计算时代,越来越多的企业将其IT基础架构迁移到公有云平台提供业务支撑,传统上我们可以自己部署一套例如ZABBIX监控平台,外加日志分析平台ELK(Elasticsearch、Logstash、Kibana)实现全局监控,但是当业务迁移到公有云平台时,其监视内容就不仅仅是传统的计算、存储、网络、硬件设备了,还需要对云平台做监视,以便清楚的知道公有云平台运行状况是否影响“我”的业务。

< font-size: 16px;">今天我们将邀请硕软(微软技术合作伙伴)的云解决方案架构师徐庭,基于国内大型企业客户的项目实践,为大家分享云原生监控平台部署中遇到的问题和对应解决方法,基于Azure Log Analytics Agent的排错指南。希望可以帮助到大家。

< font-size: 16px;">以Microsoft Azure为例,借助Azure Monitor可以:

< font-size: 16px;">以下是Azure Monitor的一个简单示意架构图

< font-size: 16px;">近日在帮助客户借助Azure Monitor服务实现企业级云原生监控平台,就使用到了上述若干组件。先看下效果图

< font-size: 16px;">但是在实施过程中也遇到不少问题,尤其是日志分析服务Log Analytics,发现无法正常推送Log Analytics Agent(又称为OMSAgent),

< font-size: 16px;">无法通过Azure Portal卸载或者通过Log Analytics断开VM连接

< font-size: 16px;">今天这里就简单总结一下遇到的问题以及对应的解决办法

< font-size: 16px;">在开始之前首先查看Azure Linux Agent是否正常运行,可以管理Linux与FreeBSD预配,以及VM与Azure底层控制器之间的交互,它是实现其他IaaS VM扩展的前提,除了提供预配功能的Linux代理外,Azure还提供对某些Linux OS使用cloud-i网站建设的主要内容nit的选项。如果非正常运行或者版本较低建议您重新安装或者升级到较新版本。可参考微软官方文档。

< font-size: 16px;">问题一:代理通信问题

< font-size: 16px;">使用Log Analytics故障排除工具查找和诊断Log Analytics代理问题,主要检查:

< font-size: 16px;">代理运行不正常,检测信号无法正常工作

< font-size: 16px;">代理未启动,无法连接到Log Analytic服务

< font-size: 16px;">代理系统日志无效



< font-size: 16px;">代理的CPU/内存使用率高

< font-size: 16px;">代理存在安装问题

< font-size: 16px;">代理自定义日志无效

< font-size: 16px;">收集代理日志

< font-size: 16px;">将以下命令粘贴到具有Log Analytics代理的计算机上的终端窗口中,可以运行故障排除工具:

< font-size: 16px;">sudo/opt/microsoft/omsagent/bin/troubleshooter

< font-size: 16px;">收集并分析Log Analytics Agent for Linux日志

< font-size: 16px;">通过日志可以发现Omsconfig.log中看到有报错信息:

< font-size: 16px;">2020/11/03 08:44:30:ERROR:null(0):EventId=1 Priority=ERROR Job 10B65B80-B048-413C-B1FF-2341EC407ADD:

< font-size: 16px;">DSC Engine Error:

< font-size: 16px;">Error Message Inventory mof does not exist.

< font-size: 16px;">Error Code:1

< font-size: 16px;">解决办法:

< font-size: 16px;">运行命令:

< font-size: 16px;">sudo su omsagent-c'python/opt/microsoft/omsconfig/Scripts/GetDscConfiguration.py'

< font-size: 16px;">此命令返回代理从门户网站看到的配置,包括系统日志设置,Linux性能计数器和自定义日志。根据提示完成相关建议操作

< font-size: 16px;">安装PaPing,检查防火墙

< font-size: 16px;">#wget https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/paping/paping_1.5.5_x86-64_linux.tar.gz

< font-size: 16px;">#tar zxvf paping_1.5.5_x86-64_linux.tar.gz

< font-size: 16px;">检查防火墙:(黄色部分替换为对应的WorkSpaceID)

< font-size: 16px;">./paping-p 443-c 10[WorkSpaceID].ods.opinsights.azure.cn

< font-size: 16px;">./paping-p 443-c 10[WorkSpaceID].oms.opinsights.azure.cn

< font-size: 16px;">重新启动OMSAgent

< font-size: 16px;">sudo/opt/microsoft/omsagent/bin/service_control restart[WorkSpaceID]

< font-size: 16px;">验证更改是否生效

< font-size: 16px;">sudo/opt/microsoft/omsagent/bin/omsadmin.sh-l

< font-size: 16px;">问题二:无法通过代理连接到Azure Monitor

< font-size: 16px;">解决办法:

< font-size: 16px;">使用以下命令(启用-v选项)通过Log Analytics Linux代理重新载入到Azure Monitor。它允许通过代理服务器重新连接到Azure Monitor的代理。

< font-size: 16px;">/opt/microsoft/omsagent/bin/omsadmin.sh-w&lt;Workspace ID&gt;-s&lt;Workspace Key&gt;-p&lt;Proxy Conf&gt;-v

< font-size: 16px;">重新启动OMSAgent

< font-size: 16px;">sudo/opt/microsoft/omsagent/bin/service_control restart[WorkSpaceID]

< font-size: 16px;">验证更改是否生效

< font-size: 16px;">sudo/opt/microsoft/omsagent/bin/omsadmin.sh-l

< font-size: 16px;">问题三:在Azure门户中,log Analytics代理扩展标记为失败状态:预配失败

< font-size: 16px;">解决办法:

< font-size: 16px;">Azure Portal中断开log Analytics连接

< font-size: 16px;">Azure Portal删除VM扩展

< font-size: 16px;">使用下面的命令清除之前产生的配置文件

< font-size: 16px;">sudo rm-rf/etc/opt/microsoft/omsagent

< font-size: 16px;">sudo rm-rf/var/opt/microsoft/omsagent

< font-size: 16px;">sudo rm-rf/opt/microsoft/omsagent

< font-size: 16px;">sudo yum remove-y scx omi omsagent omsconfig auoms

< font-size: 16px;">使用下面的命令联机下载Agent

< font-size: 16px;">wget https://raw.githubusercontent.com/Microsoft/OMS-Agent-for-Linux/master/installer/scripts/onboard_agent.sh--no-check-certificate

< font-size: 16px;">使用下面的命令解压并安装Agent

< font-size: 16px;">sh onboard_agent.sh-w[WorkSpaceID]-s[WorkSpace Key]-d opinsights.azure.cn

< font-size: 16px;">重新启动OMSAgent

< font-size: 16px;">sudo/opt/microsoft/omsagent/bin/service_control restart[WorkSpaceID]

< font-size: 16px;">验证更改是否生效

< font-size: 16px;">sudo/活动推广opt/microsoft/omsagent/bin/omsadmin.sh-l

< font-size: 16px;">问题四:无法断开log Analytics无法删除VM扩展,获取Agent状况

< font-size: 16px;">解决办法:

< font-size: 16px;">登录VM直接联机下载清除脚本卸载当前Agent【传说中的重启重装换电脑的第二大法宝】

< font-size: 16px;">wget https://raw.githubusercontent.com/microsoft/OMS-Agent-for-Linux/master/tools/purge_omsagent.sh

< font-size: 16px;">执行清除卸载Agent

< font-size: 16px;">sudo sh purge_omsagent.sh

< font-size: 16px;">使用下面的命令联机下载Agent

< font-size: 16px;">wget https://raw.githubusercontent.com/Microsoft/OMS-Agent-for-Linux/master/installer/scripts/onboard_agent.sh--no-check-certificate

< font-size: 16px;">使用下面的命令解压并安装Agent



< font-size: 16px;">sh onboard_agent.sh-w[WorkSpaceID]-s[WorkSpace Key]-d opinsights.azure.cn

< font-size: 16px;">重新启动OMSAgent

< font-size: 16px;">sudo/opt/microsoft/omsagent/bin/service_control restart[WorkSpaceID]

< font-size: 16px;">验证更改是否生效

< font-size: 16px;">sudo/opt/microsoft/omsagent/bin/omsadmin.sh-l

< font-size: 16px;">返回log Analytics Portal,查看Agent状况【应该处于未连接状态】

< font-size: 16px;">再次点击“连接”应该就工作正常了

< font-size: 16px;">在我的这个客户CASE里面,以上几个问题全部遇到,以及绝大部分采用了“重装大法”

< font-size: 16px;">此时我们就可以检索当前连接到Log Analytics工作区的CPU负载情况(Top10)

< font-size: 16px;">最后需要注意的是,当我们针对某一特定主机做日志查询与分析的时候,一定要看Log Analytics工作区里显示的名称,发现computer参数调取的是虚拟机的计算机名称,而不是Azure Portal中虚拟机名称。

< font-size: 16px;">使用如下命令可以遍历整个Log Analytics工作区的服务器信息

< font-size: 16px;">Heartbeat|where OSType=='Linux'|summarize arg_max(TimeGenerated,*)by SourceComputerId|sort by Computer|render table

< font-size: 16px;">以上,就是Log Analytics Agent排错的答题思路,希望可以为大家带来启发。

< font-size: 16px;">最后,在这个项目解决中非常感谢来自世纪互联运营的Azure技术专家的大力支持。

最佳实践 | Azure Log Analytics Agent 排错答题思路

上一篇:如何在TikTok上实现病毒式传播?
下一篇:阿里云服务器普通用户如何选择配置?


版权声明:以上主题为“最佳实践 | Azure Log Analytics Agent 排错答题思路"的内容可能是本站网友自行发布,或者来至于网络。如有侵权欢迎联系我们客服QQ处理,谢谢。
相关内容
推荐内容
扫码咨询
    最佳实践 | Azure Log Analytics Agent 排错答题思路
    打开微信扫码或长按识别二维码

小提示:您应该对本页介绍的“最佳实践 | Azure Log Analytics Agent 排错答题思路”相关内容感兴趣,若您有相关需求欢迎拨打我们的服务热线或留言咨询,我们尽快与您联系沟通最佳实践 | Azure Log Analytics Agent 排错答题思路的相关事宜。

关键词:最佳实践,|,Azure,Log,Analyt

关于 | 业务 | 案例 | 免责 | 隐私
客服邮箱:sales@1330.com.cn
电话:400-021-1330 | 客服QQ:865612759
沪ICP备12034177号 | 沪公网安备31010702002418号