添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
  • 6.4 重複元素函式: rep()
  • 6.5 算數函式 Arithmetic Computing Function
  • 6.6 組合與階乘函式: choose() 與 factorial()
  • 6.7 選擇資料函式: all(), any(), which()
  • 6.8 排序函式 Ranking and Sorting
  • 6.9 物件查看與強制轉換函式
  • 7 基本統計函式
  • 7.1 敘述統計函式
  • 7.2 類別資料表格函數
  • 7.2.1 列聯表函式: table(), xtabs()
  • 7.2.2 列聯表函式: ftable()
  • 7.2.3 列聯表函式: margin.table(), prop.table()
  • 7.3 機率函式與亂數生成函式
  • 7.4 隨機抽樣函式 sample()
  • 8 資料基本處理
  • 8.1 資料輸入套件 readr
  • 8.2 整潔資料 Tidy Data
  • 8.3 Tibble 與 Data Frame
  • 8.4 資料流動管道運算指令 Pipe
  • 8.5 資料檢視函式 glimpse()
  • 8.6 資料處裡 dplyr 套件
  • 8.6.1 選擇個體函式 filter()
  • 8.6.2 依據變數值排序函式 arrange()
  • 8.6.3 選擇變數或欄位子集函式 select()
  • 8.6.4 變數轉換函式 mutate()
  • 8.6.5 向量 if_else()
  • 8.6.6 變數重新命名 rename()
  • 8.6.7 移除缺失資料 drop_na()
  • 8.6.8 隨機抽樣函式 sample_n() sample_frac()
  • 8.6.9 選出明顯不同個體函式 distinct() n_distinct()
  • 8.6.10 利用橫列指標選出個體函式 slice()
  • 8.6.11 計算常見統計量函式 summarise()
  • 8.6.12 資料分組操作函式 group_by()
  • 8.6.13 多變數計算統計量函式 summarise_all()
  • 8.7 資料聯集與交集函式
  • 8.8 資料合併函式
  • 9 資料迭代處理
  • 9.1 對資料變數欄位 (columns) 進行相同操作
  • 9.2 對資料個體列位 (rows) 進行相同操作
  • 9.3 依據條件進行變數轉換
  • 9.4 {R} 資料物件操作函式: apply()
  • 10 文字與字串資料處理
  • 10.1 文字與字串資料基礎
  • 10.2 套件 stringr
  • 10.3 合併文字或字串 str_c()
  • 10.4 取出文字或字串向量中的部分元素 str_sub()
  • 10.5 語言設定地區與文字大小寫排序
  • 10.6 移除空白, 加入空白, 截斷文字 str_trim() str_pad()
  • 10.7 尋找特定形式文字或字串
  • 10.7.1 偵測函式 str_detect()
  • 10.7.2 確認位置函式 str_detect()
  • 10.7.3 確認索引函式 str_subset() str_which()
  • 10.7.4 取出函式 str_extract()
  • 10.7.5 配對函式 str_match()
  • 10.7.6 替代置換函式 str_replace()
  • 10.7.7 分割函式 str_split()
  • 10.8 群組尋找特定形式的文字與字串
  • 10.9 尋找連續重覆特定形式的文字與字串
  • 10.10 正規表示文字與字串 (萬用字元)
  • 11 因子資料處理
  • 11.1 forcats 套件: 基本函式
  • 11.2 移除或增加部分類別水準
  • 11.3 改變類別水準函式
  • 11.4 改變或合併類別水準函式 fct_lump()
  • 11.5 類別水準的頻率排序函式 fct_infreq()
  • 11.6 依照其他變數將類別重新排序函式 fct_reorder()
  • 12 日期時間處理
  • 12.1 lubridate 套件的日期時間
  • 12.1.1 從文字或字串轉換創件日期時間物件
  • 12.2 從date-time 資料個別成分, 創件日期時間物件.
  • 12.2.1 從已經建立的其他資料物件創件日期時間物件
  • 12.3 時區轉換
  • 12.4 取出 date-time 資料的個別成分
  • 12.5 計算時間長度
  • 12.5.1 duration 創建以秒計算的時間長度的物件
  • 12.5.2 period 創建以人類文明的時間單位計算時間長度
  • 12.5.3 interval 計算二個 date-time 物件之間的時間長度.
  • 13 統計與醫學
  • 13.1 醫學統計
  • 13.2 統計與數學
  • 13.3 醫學研究資料
  • 13.4 統計計算與統計軟體
  • 14 資料與變數
  • 14.1 醫學研究實例
  • 14.2 資料與變數 Data and Variables
  • 14.3 變數分類
  • 14.3.1 統計與變數分類
  • 14.3.2 資料數位化與變數分類
  • 14.4 單變量, 雙變量與多變量
  • 14.5 資料輸入與儲存
  • 15 Applications
  • 15.1 Example one
  • 15.2 Example two
  • 16 Final Words
  • 17 Temp
  • References
  • Published with bookdown
  • 多數時候是由資料管理人元處理後, 轉換成數值資料, 然後交由統計人員進行後續分析. 由於大數據時代來臨包含者多樣性的資料型態, 統計人員必須必須直接處裡文字或字串資料的機會也越來越多. {R} 內有許多函數可以處理文字型態的資料物件 或 文字資料 (Character Data), 常用之文字函式有 paste() , substr() , substring() , grep() , gsub() , strsplit() 等. {R} 套件 stringr 有更多處理文字或字串資料函式.

    10.1 文字與字串資料基礎

    輸入文字遠比數字複雜, 必須考慮大小寫, 空格或 Tab , 單引號或雙引號, 特殊符號與字元等等. {R} 輸入特殊符號的顯示與實際想要輸入的特殊符號有些差別.