začít pochopení toho, jak správně třídit data snímků v R
, jsme se samozřejmě musí nejprve vytvořit datový rámec manipulovat.
Poznámka: rozteč není nutná, ale zlepšuje čitelnost.,
Provedení run.R
skript vypíše seznam vektorů v naší údaje rám, jak se očekávalo, v pořadí, v jakém byly zadány.
$ Rscript run.R x y z1 apple a 42 orange d 33 banana b 24 strawberry c 1
Pořadí Funkce
i Když možná ne nejjednodušší způsob řazení typu z hlediska syntaxe, ten, který je nejvíce snadno dostupné pro všechna zařízení R
, kvůli tomu, že část base
modul, je order
funkce.,
funkceorder
přijímá řadu argumentů, ale na nejjednodušší úrovni musí být prvním argumentem posloupnost hodnot nebo logických vektorů.,
například, můžeme použít order()
jednoduše třídit vektor pět náhodně uspořádaných čísel se tento skript:
# Create unordered vectorvector = c(2, 5, 1, 3, 4)# Print vectorvector# Sort in ascending ordervector
spuštění skriptu, vidíme počáteční výstup neuspořádané vektor, následuje nyní nařídil seznam, potom:
$ Rscript run.R 2 5 1 3 4 1 2 3 4 5
Třídění Dat Rám Vektorem Jméno
order()
funkce do našeho nástroje pás, začneme třídění našich údajů rám předáním v vektor názvů v rámci datové rámu.,
například pomocí naší dříve vytvořené dataframe
objekt, můžeme třídit podle vektoru z
přidáním následujícího kódu do našeho skriptu:
# Sort by vector name dataframe
to, Co efektivně dělá, je zavolat na naše původní dataframe
objekt, a procházející v novém index pořadí, který jsme chtěli mít., Tento index pořadí je generován pomocí with()
funkce, která účinně vytváří nová prostředí pomocí prošel v datech v první argument spolu s vyjádřením k hodnocení, že údaje v druhém argumentu.
Tím, že jsme přehodnocení dataframe
data pomocí order()
funkce, a chceme, aby na základě z
vektor v, který datový rámec., To vrací nový index, aby pro datový rámec hodnot, který je nakonec vyhodnocen do dataframe
, výstup naší nové nařídil výsledek.
$ Rscript run.R x y z1 apple a 42 orange d 33 banana b 24 strawberry c 1 x y z4 strawberry c 13 banana b 22 orange d 31 apple a 4
Tudíž, vidíme, že naše původní neuspořádané výstup, následuje druhý výstup s daty, třídit podle sloupce z
.
Třídění podle Sloupce Index
Podobně jako výše uvedené metody, je také možné třídit na základě číselných index
sloupce v datovém rámu, spíše než konkrétní jméno.,
Namísto použití with()
funkce, můžeme jednoduše složit order()
funkce dataframe
. Dáváme najevo, že chceme seřadit podle sloupce index 1
pomocí dataframe
syntaxe, která způsobuje R
vrátit úrovní (názvy), že index 1
sloupce., Jinými slovy, podobně, jako když jsme míjeli v z
vektor jméno výše, order
je třídění založené na vektoru hodnot, které jsou ve sloupci index 1
:
dataframe ),]
Jak se očekávalo, dostaneme normální výstup následuje seřazený výstup v prvním sloupci:
$ Rscript run.R x y z1 apple a 42 orange d 33 banana b 24 strawberry c 1 x y z1 apple a 43 banana b 22 orange d 34 strawberry c 1
Řazení podle Více Sloupců
V některých případech, to může být žádoucí, aby třídit podle více sloupců. Naštěstí je to velmi jednoduché s dříve popsanými metodami.,
seřadit více sloupců pomocí vektorové jména, jednoduše přidat další argumenty, aby order()
volání funkce jako předtím:
# Sort by vector name then dataframe
Podobně, pokud chcete třídit podle více sloupců na základě sloupci index, přidat další argumenty, aby order()
s rozdílnými indexy:
# Sort by column index then dataframe, dataframe ),]
Napsat komentář