时间:2021-07-15 | 标签: | 作者:Q8 | 来源:徐庭网络
小提示:您能找到这篇{最佳实践 | Azure Log Analytics Agent 排错答题思路}绝对不是偶然,我们能帮您找到潜在客户,解决您的困扰。如果您对本页介绍的最佳实践 | Azure Log Analytics Agent 排错答题思路内容感兴趣,有相关需求意向欢迎拨打我们的服务热线,或留言咨询,我们将第一时间联系您! |
< ">云计算时代,越来越多的企业将其IT基础架构迁移到公有云平台提供业务支撑,传统上我们可以自己部署一套例如ZABBIX监控平台,外加日志分析平台ELK(Elasticsearch、Logstash、Kibana)实现全局监控,但是当业务迁移到公有云平台时,其监视内容就不仅仅是传统的计算、存储、网络、硬件设备了,还需要对云平台做监视,以便清楚的知道公有云平台运行状况是否影响“我”的业务。 < font-size: 16px;">今天我们将邀请硕软(微软技术合作伙伴)的云解决方案架构师徐庭,基于国内大型企业客户的项目实践,为大家分享云原生监控平台部署中遇到的问题和对应解决方法,基于Azure Log Analytics Agent的排错指南。希望可以帮助到大家。 < font-size: 16px;">以Microsoft Azure为例,借助Azure Monitor可以: < font-size: 16px;">以下是Azure Monitor的一个简单示意架构图 < font-size: 16px;">近日在帮助客户借助Azure Monitor服务实现企业级云原生监控平台,就使用到了上述若干组件。先看下效果图 < font-size: 16px;">但是在实施过程中也遇到不少问题,尤其是日志分析服务Log Analytics,发现无法正常推送Log Analytics Agent(又称为OMSAgent), < font-size: 16px;">无法通过Azure Portal卸载或者通过Log Analytics断开VM连接 < font-size: 16px;">今天这里就简单总结一下遇到的问题以及对应的解决办法 < font-size: 16px;">在开始之前首先查看Azure Linux Agent是否正常运行,可以管理Linux与FreeBSD预配,以及VM与Azure底层控制器之间的交互,它是实现其他IaaS VM扩展的前提,除了提供预配功能的Linux代理外,Azure还提供对某些Linux OS使用cloud-i网站建设的主要内容nit的选项。如果非正常运行或者版本较低建议您重新安装或者升级到较新版本。可参考微软官方文档。 < font-size: 16px;">问题一:代理通信问题 < font-size: 16px;">使用Log Analytics故障排除工具查找和诊断Log Analytics代理问题,主要检查: < font-size: 16px;">代理运行不正常,检测信号无法正常工作 < font-size: 16px;">代理未启动,无法连接到Log Analytic服务 < font-size: 16px;">代理系统日志无效 < font-size: 16px;">代理的CPU/内存使用率高 < font-size: 16px;">代理存在安装问题 < font-size: 16px;">代理自定义日志无效 < font-size: 16px;">收集代理日志 < font-size: 16px;">将以下命令粘贴到具有Log Analytics代理的计算机上的终端窗口中,可以运行故障排除工具: < font-size: 16px;">sudo/opt/microsoft/omsagent/bin/troubleshooter < font-size: 16px;">收集并分析Log Analytics Agent for Linux日志 < font-size: 16px;">通过日志可以发现Omsconfig.log中看到有报错信息: < font-size: 16px;">2020/11/03 08:44:30:ERROR:null(0):EventId=1 Priority=ERROR Job 10B65B80-B048-413C-B1FF-2341EC407ADD: < font-size: 16px;">DSC Engine Error: < font-size: 16px;">Error Message Inventory mof does not exist. < font-size: 16px;">Error Code:1 < font-size: 16px;">解决办法: < font-size: 16px;">运行命令: < font-size: 16px;">sudo su omsagent-c'python/opt/microsoft/omsconfig/Scripts/GetDscConfiguration.py' < font-size: 16px;">此命令返回代理从门户网站看到的配置,包括系统日志设置,Linux性能计数器和自定义日志。根据提示完成相关建议操作 < font-size: 16px;">安装PaPing,检查防火墙 < font-size: 16px;">#wget https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/paping/paping_1.5.5_x86-64_linux.tar.gz < font-size: 16px;">#tar zxvf paping_1.5.5_x86-64_linux.tar.gz < font-size: 16px;">检查防火墙:(黄色部分替换为对应的WorkSpaceID) < font-size: 16px;">./paping-p 443-c 10[WorkSpaceID].ods.opinsights.azure.cn < font-size: 16px;">./paping-p 443-c 10[WorkSpaceID].oms.opinsights.azure.cn < font-size: 16px;">重新启动OMSAgent < font-size: 16px;">sudo/opt/microsoft/omsagent/bin/service_control restart[WorkSpaceID] < font-size: 16px;">验证更改是否生效 < font-size: 16px;">sudo/opt/microsoft/omsagent/bin/omsadmin.sh-l < font-size: 16px;">问题二:无法通过代理连接到Azure Monitor < font-size: 16px;">解决办法: < font-size: 16px;">使用以下命令(启用-v选项)通过Log Analytics Linux代理重新载入到Azure Monitor。它允许通过代理服务器重新连接到Azure Monitor的代理。 < font-size: 16px;">/opt/microsoft/omsagent/bin/omsadmin.sh-w<Workspace ID>-s<Workspace Key>-p<Proxy Conf>-v < font-size: 16px;">重新启动OMSAgent < font-size: 16px;">sudo/opt/microsoft/omsagent/bin/service_control restart[WorkSpaceID] < font-size: 16px;">验证更改是否生效 < font-size: 16px;">sudo/opt/microsoft/omsagent/bin/omsadmin.sh-l < font-size: 16px;">问题三:在Azure门户中,log Analytics代理扩展标记为失败状态:预配失败 < font-size: 16px;">解决办法: < font-size: 16px;">Azure Portal中断开log Analytics连接 < font-size: 16px;">Azure Portal删除VM扩展 < font-size: 16px;">使用下面的命令清除之前产生的配置文件 < font-size: 16px;">sudo rm-rf/etc/opt/microsoft/omsagent < font-size: 16px;">sudo rm-rf/var/opt/microsoft/omsagent < font-size: 16px;">sudo rm-rf/opt/microsoft/omsagent < font-size: 16px;">sudo yum remove-y scx omi omsagent omsconfig auoms < font-size: 16px;">使用下面的命令联机下载Agent < font-size: 16px;">wget https://raw.githubusercontent.com/Microsoft/OMS-Agent-for-Linux/master/installer/scripts/onboard_agent.sh--no-check-certificate < font-size: 16px;">使用下面的命令解压并安装Agent < font-size: 16px;">sh onboard_agent.sh-w[WorkSpaceID]-s[WorkSpace Key]-d opinsights.azure.cn < font-size: 16px;">重新启动OMSAgent < font-size: 16px;">sudo/opt/microsoft/omsagent/bin/service_control restart[WorkSpaceID] < font-size: 16px;">验证更改是否生效 < font-size: 16px;">sudo/活动推广opt/microsoft/omsagent/bin/omsadmin.sh-l < font-size: 16px;">问题四:无法断开log Analytics无法删除VM扩展,获取Agent状况 < font-size: 16px;">解决办法: < font-size: 16px;">登录VM直接联机下载清除脚本卸载当前Agent【传说中的重启重装换电脑的第二大法宝】 < font-size: 16px;">wget https://raw.githubusercontent.com/microsoft/OMS-Agent-for-Linux/master/tools/purge_omsagent.sh < font-size: 16px;">执行清除卸载Agent < font-size: 16px;">sudo sh purge_omsagent.sh < font-size: 16px;">使用下面的命令联机下载Agent < font-size: 16px;">wget https://raw.githubusercontent.com/Microsoft/OMS-Agent-for-Linux/master/installer/scripts/onboard_agent.sh--no-check-certificate < font-size: 16px;">使用下面的命令解压并安装Agent < font-size: 16px;">sh onboard_agent.sh-w[WorkSpaceID]-s[WorkSpace Key]-d opinsights.azure.cn < font-size: 16px;">重新启动OMSAgent < font-size: 16px;">sudo/opt/microsoft/omsagent/bin/service_control restart[WorkSpaceID] < font-size: 16px;">验证更改是否生效 < font-size: 16px;">sudo/opt/microsoft/omsagent/bin/omsadmin.sh-l < font-size: 16px;">返回log Analytics Portal,查看Agent状况【应该处于未连接状态】 < font-size: 16px;">再次点击“连接”应该就工作正常了 < font-size: 16px;">在我的这个客户CASE里面,以上几个问题全部遇到,以及绝大部分采用了“重装大法” < font-size: 16px;">此时我们就可以检索当前连接到Log Analytics工作区的CPU负载情况(Top10) < font-size: 16px;">最后需要注意的是,当我们针对某一特定主机做日志查询与分析的时候,一定要看Log Analytics工作区里显示的名称,发现computer参数调取的是虚拟机的计算机名称,而不是Azure Portal中虚拟机名称。 < font-size: 16px;">使用如下命令可以遍历整个Log Analytics工作区的服务器信息 < font-size: 16px;">Heartbeat|where OSType=='Linux'|summarize arg_max(TimeGenerated,*)by SourceComputerId|sort by Computer|render table < font-size: 16px;">以上,就是Log Analytics Agent排错的答题思路,希望可以为大家带来启发。 < font-size: 16px;">最后,在这个项目解决中非常感谢来自世纪互联运营的Azure技术专家的大力支持。 |
上一篇:如何在TikTok上实现病毒式传播?
下一篇:阿里云服务器普通用户如何选择配置?
基于对传统行业渠道的理解,对互联网行业的渠道我们可以下这样一个定义:一切...
小米应用商店的后台操作和苹果是比较相似的,因为都能填写100字符关键词,允许...
小米的规则目前是在变更中的,但是根据经验小米的搜索排名评分的高低是个很重...
为了恰饭,有时候是要接入一些广告的,所以FB也专门有一个广告的SDK,这就是A...
在 2018 年于旧金山举行的游戏开发者大会上,Amazon Web Services (AWS) 曾宣布,目前世...
关于Facebook Audience Network如何收款的问题,其实官方已经给了详细的步骤。本文主要...
本文介绍了Audience Network对广告载体的质量检查,以及它重点广告形式需要注意的问...
随着iOS开发,作为开发者或公司需要针对iOS App开发涉及的方方面面作出对应的信息...
Facebook和谷歌对出海企业广告渠道都很熟悉,但事实上,在国外还有一些渠道也很...
卖家从做号的第1分钟开始,就一定要想好变现路径是什么?一定要以变现为目的去...
小提示:您应该对本页介绍的“最佳实践 | Azure Log Analytics Agent 排错答题思路”相关内容感兴趣,若您有相关需求欢迎拨打我们的服务热线或留言咨询,我们尽快与您联系沟通最佳实践 | Azure Log Analytics Agent 排错答题思路的相关事宜。
关键词:最佳实践,|,Azure,Log,Analyt