As respostas a esta pergunta no SO retornaram um conjunto de aproximadamente 125 nomes de uma a duas letras: /programming/6979630/what-1-2-letter-object-names-conflict-with-existing -r-objects
[1] "Ad" "am" "ar" "as" "bc" "bd" "bp" "br" "BR" "bs" "by" "c" "C"
[14] "cc" "cd" "ch" "ci" "CJ" "ck" "Cl" "cm" "cn" "cq" "cs" "Cs" "cv"
[27] "d" "D" "dc" "dd" "de" "df" "dg" "dn" "do" "ds" "dt" "e" "E"
[40] "el" "ES" "F" "FF" "fn" "gc" "gl" "go" "H" "Hi" "hm" "I" "ic"
[53] "id" "ID" "if" "IJ" "Im" "In" "ip" "is" "J" "lh" "ll" "lm" "lo"
[66] "Lo" "ls" "lu" "m" "MH" "mn" "ms" "N" "nc" "nd" "nn" "ns" "on"
[79] "Op" "P" "pa" "pf" "pi" "Pi" "pm" "pp" "ps" "pt" "q" "qf" "qq"
[92] "qr" "qt" "r" "Re" "rf" "rk" "rl" "rm" "rt" "s" "sc" "sd" "SJ"
[105] "sn" "sp" "ss" "t" "T" "te" "tr" "ts" "tt" "tz" "ug" "UG" "UN"
[118] "V" "VA" "Vd" "vi" "Vo" "w" "W" "y"
E código de importação R:
nms <- c("Ad","am","ar","as","bc","bd","bp","br","BR","bs","by","c","C","cc","cd","ch","ci","CJ","ck","Cl","cm","cn","cq","cs","Cs","cv","d","D","dc","dd","de","df","dg","dn","do","ds","dt","e","E","el","ES","F","FF","fn","gc","gl","go","H","Hi","hm","I","ic","id","ID","if","IJ","Im","In","ip","is","J","lh","ll","lm","lo","Lo","ls","lu","m","MH","mn","ms","N","nc","nd","nn","ns","on","Op","P","pa","pf","pi","Pi","pm","pp","ps","pt","q","qf","qq","qr","qt","r","Re","rf","rk","rl","rm","rt","s","sc","sd","SJ","sn","sp","ss","t","T","te","tr","ts","tt","tz","ug","UG","UN","V","VA","Vd","vi","Vo","w","W","y")
Como o objetivo da pergunta era apresentar uma lista memorável de nomes de objetos a serem evitados, e a maioria dos humanos não é tão boa em entender um bloco de texto sólido, eu gostaria de visualizar isso.
Infelizmente, não estou exatamente certo da melhor maneira de fazer isso. Eu tinha pensado em algo como um gráfico de caule e folhas, apenas porque não há valores repetidos cada "folha" foi colocada na coluna apropriada em vez de ser justificada. Ou uma adaptação no estilo wordcloud, onde as letras são dimensionadas de acordo com sua prevalência.
Como isso pode ser visualizado de maneira mais clara e eficiente?
As visualizações que seguem um dos seguintes se enquadram no espírito desta pergunta:
Objetivo principal: aprimorar a memorização do conjunto de nomes, revelando padrões nos dados
Objetivo alternativo: destacar recursos interessantes do conjunto de nomes (por exemplo, que ajudam a visualizar a distribuição, as letras mais comuns etc.)
As respostas em R são preferidas, mas todas as idéias interessantes são bem-vindas.
É permitido ignorar os nomes de uma letra, pois esses são mais fáceis de fornecer como uma lista separada.