Python:求代码精简“找出变动的文件的脚本”

自己的网站被入侵了,担心被挂马,所以就想写个脚本检查下(虽然有强大的第三方工具),以便进一步提升自己的编程能力。

思路:需要有一个备份的网站和一个要检测的网站,将2份网站的文件进行文件MD5值比对,从而找出变动的文件

代码写得很糙,而自己能力有限,所以就想向segmentfault的高手们学习下,帮忙指点下,看有哪些地方可以进行改进的

Python脚本

__author__ = 'Flying'

#coding:utf-8

#批量检测改动的文件

import os,sys,hashlib,datetime

global_DirOld = ""

global_DirNew = ""

global_FilesList = []

#输入要比对的文件路径

def InputDirPath():

global global_DirOld,global_DirNew

global_DirOld = unicode(raw_input(u"请输入备份文件所在目录:"),"utf-8")

while not os.path.exists(global_DirOld):

print u"指定的路径不存在,请重新输入"

global_DirOld = unicode(raw_input(u"请输入备份文件所在目录:"),"utf-8")

global_DirNew = unicode(raw_input(u"请输入要检测文件的目录:"),"utf-8")

while not os.path.exists(global_DirNew):

print u"指定的路径不存在,请重新输入"

global_DirNew = unicode(raw_input(u"请输入要检测文件的目录:"),"utf-8")

#将数据保存到文件中

def SaveToFile(filePath,content):

try:

f = open(filePath,"a+")

f.write(content.encode("utf-8") + "\n")

f.close()

except Exception,ex:

print "Error:" + str(ex)

#计算文件的MD5值

def CalcMD5(filepath):

try:

#以二进制的形式打开

with open(filepath,'rb') as f:

md5obj = hashlib.md5()

md5obj.update(f.read())

hash = md5obj.hexdigest()

return hash

except Exception,ex:

print "Error:" + str(ex)

return None

#遍历目录下的所有文件

def GetAllSubFiles():

global global_FilesList

for dir in os.walk(global_DirNew):

for file in dir[2]:

filePath = dir[0] + os.sep + file

global_FilesList.append(filePath[len(global_DirNew)+1:])

#列出新增文件和变动的文件

def ListChangedFiles():

global global_DirOld,global_DirNew,global_FilesList

print "变动或新增的文件:"

for file in global_FilesList:

filePathOld = global_DirOld + os.sep + file

filePathNew = global_DirNew + os.sep + file

if not os.path.exists(filePathOld) or CalcMD5(filePathOld)!=CalcMD5(filePathNew):

content = "[" + datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')+ "]" + filePathNew

print content

SaveToFile("ChangedFiles.txt",content)

if __name__=="__main__":

InputDirPath()

GetAllSubFiles()

ListChangedFiles()

脚本执行结果:
请输入图片描述

回答:

你可以选择一些第三方的工具来检测文件或者是目录的变动情况,比如脸书开源的watchman,又或者是nodejs中fs模块提供的watch,你需要做的工作就是过滤那些本来就要变动的文件或者目录,缓存文件或者目录就不应该被加入watch列表中.

回答:

有个比较简单的功能就是通过git进行自动化,git hooks 进行部署,第一个点是变动源进行检查,如果就是和源文件不匹配,自动进行部署回源,这个是需要自己实现,缺点是不能进行一些其他目录上没有版本控制的文件进行检查,比如是一些用户上传文件的目录,可以存贮到云服务器上面,而服务器就是仅仅存贮程序代码。

回答:

直接拿文件的修改时间,就可以吧

回答:

看到global就不想再看了

回答:

我觉得用 git 其实也挺好

回答:

Why not use pyinotify ?

python -m pyinotify -v /my-dir-to-watch

以上是 Python:求代码精简“找出变动的文件的脚本” 的全部内容, 来源链接: utcz.com/a/165223.html

回到顶部