如何使用优矿之“新闻热点”?

来源:https://uqer.io/community/share/55fa68a0f9f06cb1199d44c6

本期讲解如何使用优矿的新闻热点相关API,以及一个“然并卵”的示例策略。

包括:

  • 股票新闻热点获取:NewsHeatIndexGet
  • 股票新闻情感获取:NewsSentimentIndexGet
  • 股票相关新闻获取:NewsByTickersGet 本篇中,我们只研究沪深300成分股。
  1. from quartz.api import set_universe
  2. universe = set_universe("HS300")

1. 获取新闻热点

使用:NewsHeatIndexGet

  1. Type: function
  2. Definition: DataAPI.NewsHeatIndexGet(exchangeCD='', ticker='', secShortName='', beginDate='', endDate='', secID='', field='', pandas='1')
  3. Docstring:
  4. 包含证券相关的新闻热度指数数据,输入一个或多个证券交易代码、起止日期,获取该证券一段时间内的新闻热度指数(即证券当天关联新闻数量占当天新闻总量的百分比(%))。每天更新。(注:12014/1/1起新闻来源众多、指数统计有效,2013年及之前的网站来源不全、数据波动大,数据自2004/10/28始;2、新闻量的统计口径为经算法处理后证券关联到的所有常规新闻;3、数据按日更新。)

关键的参数:

  • secID: 证券代码列表
  • beginDate:新闻搜索开始日期
  • endDate:新闻搜索结束日期
  1. data = DataAPI.NewsHeatIndexGet(secID=universe, beginDate="20150916", endDate="20150916")
  2. data.sort('heatIndex', ascending=False).head()
secIDexchangeCDexchangeNametickersecShortNamenewsPublishDateheatIndexinsertTimeupdateTime
125600030.XSHGXSHG上海证券交易所600030中信证券2015-09-164.7261012015-09-16 01:10:032015-09-17 13:53:26
205600837.XSHGXSHG上海证券交易所600837海通证券2015-09-163.5087722015-09-15 22:05:042015-09-17 13:53:26
251601688.XSHGXSHG上海证券交易所601688华泰证券2015-09-162.6852852015-09-16 01:36:042015-09-17 13:53:26
241601398.XSHGXSHG上海证券交易所601398工商银行2015-09-162.5420692015-09-15 22:30:082015-09-17 13:53:26
269601939.XSHGXSHG上海证券交易所601939建设银行2015-09-162.3988542015-09-15 22:30:082015-09-17 13:53:26

获取的数据列表中,每一行就是对应的证券在某一天的新闻热度(heatIndex)。可以看到9月16日,中信证券(600030)荣登热度排行榜榜首!

2. 获取新闻情感

光知道新闻热度的话不够,我们还需要这道整体的新闻情感(正面or负面?)。

使用:NewsSentimentIndexGet

  1. Type: function
  2. Definition: DataAPI.NewsSentimentIndexGet(exchangeCD='', ticker='', secShortName='', beginDate='', endDate='', secID='', field='', pandas='1')
  3. Docstring:
  4. 包含证券相关的新闻情感指数数据,输入一个或多个证券交易代码、起止日期,获取该证券一段时间内的新闻情感指数(即当天证券关联新闻的情感均值)。(注:12014/1/1起新闻来源众多、指数统计有效,2013年及之前的网站来源不全、数据波动大,数据自2004/10/28始;2、新闻量的统计口径为经算法处理后证券关联到的所有常规新闻;3、数据按日更新。)

关键的参数:

  • secID: 证券代码列表
  • beginDate:新闻搜索开始日期
  • endDate:新闻搜索结束日期
  1. data = DataAPI.NewsSentimentIndexGet(secID=universe, beginDate="20150916", endDate="20150916")
  2. data.sort('sentimentIndex', ascending=True).head()
secIDexchangeCDexchangeNametickersecShortNamenewsPublishDatesentimentIndexinsertTimeupdateTime
49000831.XSHEXSHE深圳证券交易所000831五矿稀土2015-09-16-0.2947022015-09-16 09:20:072015-09-17 14:03:25
125600030.XSHGXSHG上海证券交易所600030中信证券2015-09-16-0.1714862015-09-16 01:10:032015-09-17 14:03:25
171600489.XSHGXSHG上海证券交易所600489中金黄金2015-09-16-0.1621012015-09-16 02:05:342015-09-17 14:03:25
231601225.XSHGXSHG上海证券交易所601225陕西煤业2015-09-16-0.1621012015-09-16 02:05:342015-09-17 14:03:25
95002653.XSHEXSHE深圳证券交易所002653海思科2015-09-16-0.1547202015-09-15 20:35:052015-09-17 14:03:25

获取的数据列表中,每一行就是对应的证券在某一天的新闻情感(heatIndex),负数代表负面情感,正数代表正面情感。可以看到9月16日,中信证券(600030)在新闻情感指数榜上排名倒数第二!

3. 股票详细新闻获取

用户如果想更深度的剖析个别新闻对某只证券的影响,可以通过API获取详细的新闻分析列表:

使用:NewsByTickersGet

  1. Type: function
  2. Definition: DataAPI.NewsByTickersGet(ticker='', secShortName='', secID='', exchangeCD='', beginDate='', endDate='', field='', pandas='1')
  3. Docstring:
  4. 包含证券相关的新闻数据,同时可获取针对不同证券的新闻情感数据。输入证券代码或简称、查询的新闻发布起止时间,同时可输入证券交易所代码,获取相关新闻数据,如:新闻ID、新闻标题、发布来源、发布时间、入库时间等。(注:1、自2014/1/1起新闻来源众多、新闻量日均4万左右,2013年及之前的网站来源少、新闻数据量少;2、数据实时更新。)

关键的参数:

  • secID: 证券代码列表
  • beginDate:新闻搜索开始日期
  • endDate:新闻搜索结束日期 我们来试着获取2015年9月16日当天中信证券的相关新闻:
  1. data = DataAPI.NewsByTickersGet(secID='600030.XSHG', beginDate='20150916', endDate='20150916')
  2. data.sort('relatedScore', ascending=False).head(10)
secIDexchangeCDexchangeNametickersecShortNamenewsIDnewsTitlerelatedScoresentimentsentimentScorenewsPublishSitenewsPublishTimenewsInsertTime
71600030.XSHGXSHG上海证券交易所600030中信证券14554253“股民好伴侣”南方理财金H详细操作指南0.999999-1-0.028868中国经济网2015-09-16 09:27:002015-09-16 09:41:30
106600030.XSHGXSHG上海证券交易所600030中信证券14564116嘉实超短债债券:2015年第八次收益分配公告0.999993-1-0.196649证券之星2015-09-16 13:16:232015-09-16 13:37:17
118600030.XSHGXSHG上海证券交易所600030中信证券14575307银华交易型货币(ETF):关于增加东兴证券、中航证券为基金申购赎回代理机构的公告0.999950-1-0.402002证券之星2015-09-16 16:14:012015-09-16 16:57:18
31600030.XSHGXSHG上海证券交易所600030中信证券14539393中信证券总经理程博明被查 已有11名骨干被带走0.999950-1-0.097207新浪财经2015-09-16 02:42:002015-09-16 03:19:25
19600030.XSHGXSHG上海证券交易所600030中信证券14537527中信三家营业部“重出江湖” 7个交易日买入A股119.49亿元占比近17%0.999181-1-0.133462新浪财经2015-09-16 01:36:002015-09-16 01:40:36
33600030.XSHGXSHG上海证券交易所600030中信证券14539225中信证券危机应对:火上浇油0.998778-1-0.253825和讯网2015-09-16 03:14:102015-09-16 03:16:14
40600030.XSHGXSHG上海证券交易所600030中信证券14551566中信证券事件再升级:总经理被查 遇前所未有危机0.998508-1-0.225816网易财经2015-09-16 05:01:252015-09-16 08:58:45
61600030.XSHGXSHG上海证券交易所600030中信证券14548828中信证券事件再升级:总经理程博明被查0.998508-1-0.221037中国证券网2015-09-16 08:08:432015-09-16 08:12:59
129600030.XSHGXSHG上海证券交易所600030中信证券14584031复盘中信证券:它曾是证券行业的新一代龙头0.997775-1-0.008536金融界2015-09-16 21:44:482015-09-16 21:50:33
53600030.XSHGXSHG上海证券交易所600030中信证券14549075“国家队主攻手”陷救市漩涡 中信证券总经理程博明被调查0.997283-1-0.159776新华网2015-09-16 07:26:002015-09-16 08:16:56

4. 使用新闻数据编写简单策略

策略的指导想法是买入市场关为热点,并且新闻情感为正面的股票。

策略参数:

  • 开始日期:2010年1月1日
  • 结束日期:2015年9月1日
  • 选择域:沪深成分股(2010年1月1日采样)
  • 调仓周期:10个交易日
  • 买入方法:等权重买入
  • 规则:选取热度最高的100支股票,从中再选取情感最高并且为正的20支。
  1. from CAL.PyCAL import *
  2. start = '2010-01-01'
  3. end = '2015-09-01'
  4. benchmark = 'HS300'
  5. universe = set_universe('HS300', start)
  6. capital_base = 1000000
  7. freq = 'd'
  8. refresh_rate = 10
  9. def initialize(account):
  10. pass
  11. def handle_data(account):
  12. cal = Calendar('China.SSE')
  13. endDate = cal.advanceDate(account.current_date, '-1b', BizDayConvention.Preceding)
  14. beginDate = cal.advanceDate(endDate, '-10b', BizDayConvention.Preceding)
  15. # 获取当前参考期内股票热度
  16. data = DataAPI.NewsHeatIndexGet(secID=account.universe, beginDate=beginDate.strftime("%Y%m%d"), endDate=endDate.strftime("%Y%m%d"))
  17. # 只选取热度排名前100的股票
  18. sortedHeatIndex = data.groupby('secID')[['secID', 'heatIndex']].mean()
  19. choosenStocks = list(sortedHeatIndex.sort('heatIndex', ascending=False).index[:100].values)
  20. # 获取选取的50支股票的情感指数
  21. data = DataAPI.NewsSentimentIndexGet(secID=choosenStocks, beginDate=beginDate.strftime("%Y%m%d"), endDate=endDate.strftime("%Y%m%d"))
  22. # 只选取正面情感最高的20支股票
  23. data = data.groupby('secID')[['secID', 'sentimentIndex']].mean()
  24. sortedSentimentIndex = data.sort('sentimentIndex', ascending=False)
  25. sortedSentimentIndex = sortedSentimentIndex[sortedSentimentIndex['sentimentIndex'] > 0]
  26. choosenStocks = list(sortedSentimentIndex.index[:20].values)
  27. estimtedPortfolioValue = account.referencePortfolioValue
  28. # 卖出当前持仓
  29. for s in account.valid_secpos:
  30. order_to(s, 0)
  31. # 等比例买入选择股票
  32. for s in choosenStocks:
  33. order(s, int(estimtedPortfolioValue / len(choosenStocks) / account.referencePrice[s] / 100.)*100)

如何使用优矿之“新闻热点”? - 图1

看来这么简单的想法确实是“然并卵”!