自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

两只橙的博客

淡泊以明志,宁静以致远

原创 写给毕业三年后的自己

时光飞逝,日月如梭,不知不觉毕业三年了。 三年时光,有开心 ,有伤心 ,有得,有失,细数一下好像也没啥成就。 普普通通的工作,普普通通的学习,普普通通的游玩。偶尔约上三五知己,吹吹水,述说生活的艰辛与不易,分享努力过后的回报。 三年期间: 考了《软件设计师》职称(虽算不是含金量十足,至少说明我...

2020-10-18 19:15:19 4076 15

原创 写给毕业两年后的自己

题记——时间不回来,记忆散不开 时间是让人猝不及防的东西,到今天为止不知不觉毕业两年了,从开始的懵懂到现在的迷茫再到对未来的期待,心态不断的发生着变化,唯一不变的可能就是那颗对未来充满好奇的心吧! 本想用诗歌或散文的形式来总结这两年来的遭遇,偶遇以及邂逅,奈何文笔拙略,只能以类日记的口吻总结(来自...

2020-10-18 19:03:55 455 0

原创 第一章(1.1)——知识图谱简介

1.1 什么是知识图谱 1.2 知识图谱常见存储方式 1.3 知识图谱应用 1.4 展望

2020-07-26 13:30:56 245 0

原创 第二章(1.1)——图形数据库neo4j安装

1.1 neo4j下载 本专栏提供两种下载方式,一种是官网下载,另一种是百度网盘下载(推荐) 官网下载地址:https://neo4j.com/download-center/ 百度网盘下载地址:https://pan.baidu.com/s/1hygHS6_W5rqoAc41V30sTQ 提取...

2020-07-21 23:08:54 101 0

原创 2019CSDN博客之星评选,博星冲刺,请大家多多支持!

感谢各位志同道合技术人以及各位粉丝的支持,博主被官方评定为2019 CSDN博客TOP200。 第一次写CSDN博客到现在已经过去三年了,不知不觉就写了三年,发表了200多篇文章。 记得刚开始写只是为了记录开发过程中遇到的各种坑,等以后遇到后能快速查阅,现在看来都是一些十分低级的bug。 参加工作...

2020-01-11 00:23:47 1666 1

原创 深度学习实战·第一章(1.1)——Windows下的Pycharm远程连接虚拟机中Centos下的Python环境

Windows下的Pycharm远程连接虚拟机中Centos下的Python环境 1、准备工作: 固定centos的IP,这里我的固定IP为 192.168.254.128 centos中安装ssh。(这里我采用的是ssh的远程连接) centos中Python环境已安装2...

2019-10-01 17:28:11 4495 6

原创 人机交互系统(1.4)——Trie树详解

一、Trie树应用 在 NLP 中一般会用其存储大量的字典字符以用于文本的快速分词;除此之外,典型应用场景还包括大批量文本的:词频统计、字符串查询和模糊匹配(比如关键词的模糊匹配)、字符串排序等任务;由于 Trie 大幅降低了无谓的字符串比较,因此在执行上述任务时,其效率非常的高。 二、Tri...

2019-09-19 23:49:58 2723 5

原创 SpringBoot实战教程(3.1)——失败重试机制

一、Guava-Retry Guava retryer工具与spring-retry类似,都是通过定义重试者角色来包装正常逻辑重试,但是Guava retryer有更优的策略定义,在支持重试次数和重试频度控制基础上,能够兼容支持多个异常或者自定义实体对象的重试源定义,让重试功能有更多的灵...

2019-09-18 21:41:38 1388 2

原创 23种设计模式——策略模式

一、列表工具类 1、对两个列表去重并合并。 import com.google.common.collect.Lists; import com.google.common.collect.Sets; import org.apache.commons.collections4.Colle...

2019-08-18 14:06:06 1471 3

原创 人机交互系统(3.1)——NLP文本数据增强方法

一、数据增强的背景和应用场景 随着AI技术的逐步发展,更好的神经网络模型对数据规模的要求也逐步提升。而在分类任务中,若不同类别数据量相差很大,模型则会出现过拟合现象,严重影响预测的正确性。 从广义上来讲,有监督模型的效果相对半监督或无监督学习都是领先的。但是有监督模型需要获取大量的标注数据...

2019-08-03 11:13:40 2017 0

原创 人机交互系统(2.2)——Embedding的历史由来

1 前言 首先回顾一下自然语言处理中的一个基本问题: 如何计算一段文本序列在某种语言下出现的概率? 之所以称其为一个基本问题,是因为它在很多NLP任务中都扮演着重要的角色。 例如:去哪 。。。联想到“ 吃饭!”的概率,即“吃饭”这个词在“去哪”这种语言环境下出现的概率。 2 词向...

2019-07-07 12:42:55 1425 0

原创 人机交互系统(2.1)——深度学习分布式计算框架

1 为什么需要分布式计算? 在这个数据爆炸的时代,产生的数据量不断地在攀升,从GB,TB,PB到ZB。挖掘其中数据的价值也是企业在不断地追求的终极目标。但是要想对海量的数据进行挖掘,首先要考虑的就是海量数据的存储问题,比如TB量级的数据。 谈到数据的存储,则不得不说的是磁盘的数据读写速度问题。...

2019-07-04 22:55:32 1587 0

原创 个性化推荐系统设计(4.1)——案例分析

在过去的十年中,神经网络已经取得了巨大的飞跃。如今,神经网络已经得以广泛应用,并逐渐取代传统的机器学习方法。 接下来,我要介绍一下YouTube如何使用深度学习方法来做个性化推荐。 由于体量庞大、动态库和各种观察不到的外部因素,为YouTube用户提供推荐内容是一项非常具有挑战性的任务。 Yo...

2019-05-19 00:16:23 1985 0

原创 个性化推荐系统设计(2.1)——推荐算法介绍

协同过滤算法 协同过滤(Collaborative filtering, CF)算法是目前个性化推荐系统比较流行的算法之一。 协同算法分为两个基本算法:基于用户的协同过滤(UserCF)和基于项目的协同过滤(ItemCF)。 基于属性的推荐算法 基于用户标签的推荐 统计用...

2019-05-11 17:54:58 1133 0

原创 人机交互系统(1.1) ——Annoy算法(海量数据查找)

前言 一旦文档变成这种稠密向量形式,那如何从海量文本中快速查找出相似的Top N 文本呢? 这就不得不提到一个海量数据相似查找算法——Annoy算法。 算法原理 建立索引 Annoy的目标是建立一个数据结构,使得查询一个点的最近邻点的时间复杂度是次线性。Annoy 通过建立一个二叉树...

2019-03-02 18:46:53 1052 0

原创 人机交互系统(1.2) ——深度神经网络(孪生网络)

一、前言 深度神经网络通常比较擅长从高维数据中学习,例如图像或者语言,但这是建立在它们有大量标记的样本来训练的情况下。然而,人类却拥有单样本学习的能力——如果你找一个从来没有见过小铲刀的人,给他一张小铲刀的图片,他应该就能很高效的将它从其他厨房用具里面鉴别出来。 这是一种对人类来说很容易的...

2019-03-01 17:23:48 1391 0

原创 第六章(1.1)自然语言处理实战——TF-IDF算法原理

一、什么是TF-IDF TF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文件频率). 是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。...

2018-03-30 15:09:43 723 0

原创 第六章(1.7)深度学习实战——用lstm做小说预测

一、简介 长短期记忆网络 LSTM(Long-Short Term Memory)是递归神经网络(RNN:Recurrent Neutral Network)的一种。 RNNs也叫递归神经网络序列,它是一种根据时间序列或字符序列(具体看应用场景)自我调用的特殊神经网络。将它按序列展开后,就成...

2018-03-21 16:09:05 1985 0

原创 第六章(1.5)深度学习实战——利用RNN和LSTM生成小说题记

一、选取素材 本文选取的小说素材来自17k小说网的一篇小说,手工复制小说中的题记。 小说网址:http://www.17k.com/list/2793873.html 训练语料如下: 语料格式 题记:此情可待成追忆,只是当时已惘然。 二、开发环境 ten...

2018-03-16 19:24:28 1470 0

原创 第六章(1.6)机器学习实战——打造属于自己的贝叶斯分类器

github项目地址:https://github.com/liangzhicheng120/bayes 一、简介 项目使用SpringBoot做了一层web封装 项目使用的分词工具hanlp 项目使用JDK8 贝叶斯法则 事件A在事件B(发生)的条件下的概率,与事件B在...

2018-03-13 17:49:30 624 0

原创 第六章(1.4)自然语言处理实战——时间语义抽取

项目github地址:https://github.com/liangzhicheng120/nlp 一、简介 本工具是由复旦NLP中的时间分析功能修改而来,做了一些细节和功能的优化,经SpringBoot封装成web工具。 泛指时间的支持,如:早上、晚上、中午、傍晚等。...

2018-03-12 16:28:38 3794 10

原创 第六章(1.2)自然语言处理实战——打造属于自己的中文word2vector工具

一、环境 python3.6安装 anaconda安装 jieba安装 gensim安装 IDEA 编辑器安装 二、实战演练 训练语料source.txt 9月12日随着颁奖典礼的结束,我院获得了商委系统运动会系列活动之一——足球比赛的季军...

2018-03-09 10:37:33 3469 6

原创 第五章(1.7)深度学习——常用的八种神经网络性能调优方案

一、神经网络性能调优主要方法 数据增广 图像预处理 网络初始化 训练过程中的技巧 激活函数的选择 不同正则化方法 来自于数据的洞察 集成多个深度网络 1. 数据增广 在不改变图像类别的情况下,增加数据量,能提高模型的泛化能力。 自然图像的数据增广方式包括...

2018-02-23 10:57:27 4479 0

原创 springboot报错:Property 'sqlSessionFactory' or 'sqlSessionTemplate' are required错误详解

问题一 在Mapper层,它是需要加@Mapper注解的,但是网上又有人加@respository,两个注解混起来了,其实是任选其一都可以的。一般都是使用@Mapper。但是如果在Mapper层中加了注解,在配置主类SpringBootMybatisApplication里面就不需要@Mapper...

2019-11-24 14:08:08 3310 0

原创 【自然语言实战】·第二章(1.1)——获取词语首字字母

一、maven依赖 <dependency> <groupId>net.sourceforge.pinyin4j</groupId> <artifactId>pinyin4j<...

2019-11-17 14:09:56 223 0

原创 第七章·深度学习实战(1.5)——深度学习几大难点

一、局部最优问题 深度学习算法的目标函数,几乎全都是非凸的。而目前寻找最优解的方法,都是基于梯度下降的。稍微有点背景知识的人都知道,梯度下降方法不能解决是解决非凸问题的。因此,如果找到最优解,将是深度学习领域,非常值得研究的课题。 andrew在google的工作,也就是那只猫,其实训练过程是让人...

2019-10-24 23:43:54 243 0

原创 第六章(1.8)深度学习实战——深度学习模型训练痛点及解决方法

一 模型训练基本步骤 进入了AI领域,学习了手写字识别等几个demo后,就会发现深度学习模型训练是十分关键和有挑战性的。选定了网络结构后,深度学习训练过程基本大同小异,一般分为如下几个步骤 定义算法公式,也就是神经网络的前向算法。我们一般使用现成的网络,如inceptionV4,mobilenet...

2019-10-20 19:02:39 363 0

原创 Springboot异常java.lang.StackOverflowErrorfen分析及解决办法

一、报错信息 Caused by: java.lang.StackOverflowError: null at java.io.ObjectInputStream$BlockDataInputStream.readByte(ObjectInputStream.java:2774) at ...

2019-10-13 12:52:02 2225 0

原创 23种设计模式——单例模式(枚举类实现)

一、枚举实现单例模式优势 单例模式约束一个类只能实例化一个对象。在Java中,为了强制只实例化一个对象,最好的方法是使用一个枚举量。这个优秀的思想直接源于Joshua Bloch的《Effective Java》 这里有几个原因关于为什么在Java中宁愿使用一个枚举量来实现单例模式: 1、 ...

2019-08-26 10:52:45 270 0

原创 SpringBoot实战教程(3.2)——启动指定执行顺序

一、springboot启动类 package com.rule.engine; import org.springframework.boot.SpringApplication; import org.springframework.boot.autoconfigure.Spring...

2019-08-24 20:26:05 1764 0

原创 23种设计模式——责任链模式

本文将结合个性化推荐系统中的广告推荐流程来讲解责任链模式,广告位经过定义的责任链 预处理—>召回模块—>粗排序模块—>精排序模块—>规则模块—> 资讯模块—>后处理:上报信息 得到个性化的推荐广告位,来讲解责任链模式在实际生产中的使用方式。 一、配置信息 ...

2019-08-24 13:54:37 613 1

原创 Pgsql报错:PostgreSQL的SQL语句参数上限报错

一、报错信息 Mybatis + PostgreSQL-JDBC-Driver 42.1.4批量插入24178条数据(每条30字段).报如下错误: PgSQL 9.6 Cause: org.postgresql.util.PSQLException: An I/O error occurre...

2019-08-10 11:44:40 1824 0

原创 个性化推荐系统设计(2.2)——Few-shot Learning用于冷启动的探索

在推荐领域,我们常常会遇到冷启动的问题,这可能在所有的推荐项目中或多或少都会涉及。对于该问题,通常的解决方法如下: ①(提供非个性化的推荐)比如先推荐热门排行榜,收集一定用户数据后,再进行个性化推荐; ②(用户冷启动)利用注册时的用户信息粗粒地个性化推荐; ③(用户冷...

2019-07-28 10:06:35 505 0

原创 第一章 JDK8 API解析(1.1) MAP新增的merge方法介绍

1.Map.merge方法介绍 jdk8对于许多常用的类都扩展了一些面向函数,lambda表达式,方法引用的功能,使得java面向函数编程更为方便。其中Map.merge方法就是其中一个,merge方法有三个参数,key:map中的键,value:使用者传入的值,remappingFunction...

2019-07-20 16:11:03 299 0

原创 第五章(1.8)金典网络解读—LeNet5、AlexNet、VGGNet

1 LeNet5 一种典型的用来识别数字的卷积网络是LeNet-5。 1.1 模型结构 LeNet-5共有7层(不包含输入层),每层都包含可训练参数;每个层有多个Feature Map,每个FeatureMap通过一种卷积滤波器提取输入的一种特征,然后每个FeatureMap有多个神经元。 ...

2019-07-20 10:47:19 337 1

原创 人机交互系统(4.1)——深度学习在人脸检测中的应用

1 人脸检测 在目标检测领域可以划分为了人脸检测与通用目标检测,往往人脸这方面会有专门的算法(包括人脸检测、人脸识别、人脸其他属性的识别等等),并且和通用目标检测(识别)会有一定的差别,着主要来源于人脸的特殊性(有时候目标比较小、人脸之间特征不明显、遮挡问题等),下面将从人脸检测和通用目标检测两...

2019-07-04 23:26:06 762 1

原创 人机交互系统(1.3)——自然语言处理过程

一、收集数据 1.1 数据源的样例 每一个机器学习问题都是从数据开始的,比如电子邮件、帖子或tweet列表。常见的文本信息来源包括: 产品评论(亚马逊,Yelp,各种应用商店) 用户生成内容(tweet、Facebook帖子、StackOverflow问题) 故障排除(客户请求、支持...

2019-06-09 12:48:34 1103 0

原创 python pandas操作excel合并指定文件夹下的多个excel

import os import sys import xlrd import xlsxwriter import pandas as pd def get_file_list(dir, file_type_list=['txt', 'csv...

2019-06-05 15:14:37 5843 0

原创 第六章(1.8)自然语言处理实战——Jieba中文分词,WordEmbedding的概念和实现

一、 NLP 走近自然语言处理 概念 Natural Language Processing/Understanding,自然语言处理/理解 日常对话、办公写作、上网浏览 希望机器能像人一样去理解,以人类自然语言为载体的文本所包含的信息,并完成一些特定任务 内容 中文分词、词性标注、命名实...

2019-05-21 19:42:39 844 0

原创 java 时间处理工具类

1、java 时间处理工具类 package com.meizu.mdsp.common.utils; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Calendar; i...

2019-05-19 15:24:43 301 0

提示
确定要删除当前文章?
取消 删除