博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Atitit.论图片类型 垃圾文件的识别与清理 流程与设计原则 与api概要设计 v2 pbj...
阅读量:6236 次
发布时间:2019-06-22

本文共 2011 字,大约阅读时间需要 6 分钟。

Atitit.论图片类型 垃圾文件的识别与清理  流程与设计原则 与api概要设计 v2 pbj

 

 

1俩个问题::识别垃圾文件与清理策略1

2如何识别垃圾图片1

2.1. 体积过小文件<10kb1

2.2. 增加扩展名对于无扩展名文件1

2.3. 清理非图片(bmp,jpg,jpeg,png)的文件2

2.4. 尺寸过小图片(210*1502

2.5. 清理广告图片(高度宽度不成比例)超长超宽图片2

2.6. 清理重复图片(此结果不能加入指纹库)2

2.7. 非本类别的图片(人工识别)2

3垃圾图片文件指纹库3

3.1. 根据垃圾文件指纹库(模式结果固化)3

3.2. 根据垃圾文件路径名称库(加快性能比对速度,md5可能比较慢)3

4人工识别垃圾图片策略3

5清理策略3

6Code3

6.1. 文件去重4

 

 

 

1. 俩个问题::识别垃圾文件与清理策略

 

2. 如何识别垃圾图片

2.1. 体积过小文件<10kb

2.2. 增加扩展名对于无扩展名文件

package com.attilax.clr;

 

import com.attilax.clr.imp.MoveExcuter;

import com.attilax.clr.imp.NoPicReconer;

import com.attilax.clr.imp.tooMinSizePicClrerPartImp;

import com.attilax.clr.imp.tooMiniPixPicClrerPartImp;

 

public class ClrerPicClrer extends ClrerAbs {

 

 

public static void main(String[] args) {

ClrerPicClrer c=new ClrerPicClrer();

c.dir="d:\\ati\\isheo";

c.dir="D:\\ati\\p2015\\pic_p";

 

NoExtnameCheckerImp  neImp=new NoExtnameCheckerImp();

c.PreProcessor=neImp;

 

c.traveDir(c.dir);

System.out.println("--f");

2.3. 清理非图片(bmp,jpg,jpeg,png)的文件

Gif js 

2.4. 尺寸过小图片(210*150

2.5. 清理广告图片(高度宽度不成比例)超长超宽图片

长宽比大于2的图片

2.6. 清理重复图片(此结果不能加入指纹库)

部分重复文件是广告文件,所以容易重复

 

2.7. 非本类别的图片(人工识别)

作者:: 老哇的爪子 Attilax 艾龙,  EMAIL:1466519819@qq.com

转载请注明来源: http://blog.csdn.net/attilax

 

3. 垃圾图片文件指纹库

3.1. 根据垃圾文件指纹库(模式结果固化)

3.2. 根据垃圾文件路径名称库(加快性能比对速度,md5可能比较慢)

 

4. 人工识别垃圾图片策略

不好的isho

不能likepic

误删除的文件专门集中放在isho_manu文件夹中,人工处理

 

 

 

5. 清理策略

生成清理脚本(或者直接java程序模式)

移动到制定文件夹(推荐)

 

 

6. Code

AtibrowPrj

public class ClrerPicClrer extends ClrerAbs {

 

 

public static void main(String[] args) {

ClrerPicClrer c=new ClrerPicClrer();

c.dir="d:\\ati\\isheo";

//c.GabFileRecongers.add(new NoPicReconer());

tooMiniPixPicClrerPartImp ClrerPartImp = new tooMiniPixPicClrerPartImp();

ClrerPartImp.dir=c.dir;

ClrerPartImp.targetDir="d:\\ati\\tooMiniPixPic_files";

c.IClrerParts.add(ClrerPartImp);

tooMinSizePicClrerPartImp tmsc=new tooMinSizePicClrerPartImp();

tmsc.dir=c.dir;

tmsc.targetDir="d:/ati/tooMinSize_files";

c.IClrerParts.add(tmsc);

 

c.traveDir(c.dir);

System.out.println("--f");

}

 

 

 

6.1. 文件去重

DeduliAbs_ByMoveToNewFolder.java

 

 

你可能感兴趣的文章
iPad和iPhone开发的比较
查看>>
mysql 针对单张表的备份与还原
查看>>
Gerrit使用简介
查看>>
SQL2008报表三种实现Reporting Service2008匿名访问的方法(转)
查看>>
emacs 根据文件名自动加载内容
查看>>
Win7最高权限问题
查看>>
pdf关闭工具栏
查看>>
java设计模式10:Flyweight
查看>>
javascript笔记:深入分析javascript里对象的创建(上)
查看>>
获取引用js文件所在的路径(做jquery插件用)
查看>>
Android实现计时与倒计时的几种方法
查看>>
日期相关
查看>>
Windows Server 8 开发预览版
查看>>
CentOS在同一个窗口打开文件夹
查看>>
从零开始学MVC3——创建项目
查看>>
java笔记:熟练掌握线程技术---基础篇之解决资源共享的问题(中)--中篇
查看>>
Windows MDL原理总结
查看>>
12篇学通C#网络编程——第二篇 HTTP应用编程(上)(转)
查看>>
SSH服务连接时常见问题解答
查看>>
SQL Server2012中的Throw语句尝试
查看>>