C#格式化英文字母的三種方法
本人學(xué)習(xí)C#有很長(zhǎng)一段時(shí)間了,總結(jié)了一下C#格式化英文字母主要有三種方法,下面就來(lái)簡(jiǎn)單的介紹一下。
第一種方法:調(diào)用Char.ToUpper(),Char.ToLower()方法
第二種方法:api調(diào)用法:
string str = "BaSiC";
string strUpper = str.ToUpper();
string strLower = str.ToLower();
下面我來(lái)著重講一下第三種方法,這種方法看起來(lái)復(fù)雜一點(diǎn),但執(zhí)行的效率還不錯(cuò)。
第三種方法:使用for循環(huán)來(lái)判斷,如果是大寫就,如果是小寫就..
首先觀察大寫字母和小寫字母的異同:
打印上面的代碼如下,有興趣的可以自己試試打印這樣的表格出來(lái):
Console.WriteLine("{0,-3} | {1,-6} | {2,-8} | {3,-3} | {4,-6} | {5,-8}",
"小寫", "ascil", "2進(jìn)制", "大寫", "ascil", "2進(jìn)制");
IEnumerable chars = Enumerable.Range('a', 'z' - 'a' + 1).Select(i => (char)i);
foreach (char c in chars)
{
char upperC = char.ToUpper(c);
Console.WriteLine("{0,-5} | {1,-6} | {2,-10} | {3,-5} | {4,-6} | {5,-10}",
c, (int)c, Convert.ToString(c, 2),
upperC, (int)upperC, Convert.ToString(upperC, 2));
}
從上面很容易看的出來(lái)’a’ 比大寫的’A’ 的ascil多32,從這點(diǎn)出發(fā)就可以得到下面的代碼:
private static char[] GetUpperChars(string str)
{
char[] chars = str.ToCharArray();
for (int i = 0; i < chars.Length; i++)
{
if (char.IsLower(chars[i]))
{
chars[i] = (char)(chars[i] - 32);
}
}
return chars;
}
這段代碼使用for循環(huán)并加入判斷,如果是小寫,則將其值減去32,調(diào)用也比較簡(jiǎn)單:
string strUpper2 = new string(GetUpperChars(str));
這段代碼唯一的缺點(diǎn)是進(jìn)行了IsLower的判斷,可不可以在沒(méi)有判斷的情況下來(lái)修改chars使其變成大寫呢?
如果從Ascii 的角度來(lái)解決這個(gè)問(wèn)題,那么我們就必須使用大小寫的判斷,我在匯編語(yǔ)言的書(shū)上看到了這句話:
如果一個(gè)問(wèn)題的解決方案,使我們陷入一種矛盾之中,那么很可能是我們考慮問(wèn)題的出發(fā)點(diǎn)有了問(wèn)題,或者說(shuō)我們起初運(yùn)用的規(guī)律并不適合。
這段話的意思是,可能我們應(yīng)該從其他角度來(lái)觀察,而不應(yīng)該從Ascii的角度來(lái)觀察。
如果不從Ascii的角度來(lái)觀察,那還能從哪里來(lái)觀察呢?
可以從2進(jìn)制的角度來(lái)觀察。
還是這幅圖,只是我們的觀察角度變成了2進(jìn)制。
a 的2進(jìn)制:1100001, b的2進(jìn)制1100010,..
A 的2進(jìn)制: 1000001, B的2進(jìn)制1000010,..
可以知道a的第5位是1,而A的第5位是0,(從右邊往左邊數(shù),0開(kāi)始,后面得第幾位都這樣數(shù))
b的第5位是1,而B(niǎo)的第5位是0,
..
所以如果要將一個(gè)字符串變成大寫,只需要將字符串的所有字符的第5位全部變成1就可以了。
而如何將一個(gè)字符的第5位變成1呢?
答案是使用And(位運(yùn)算)操作.
首先a 是個(gè)7位字符,只所以是7位,是因?yàn)樵谥贫ˋscii的時(shí)候位比較貴,8位比較浪費(fèi),而6位又不夠,所以ascii碼是7位的,這點(diǎn)從
a 是1100001 就可以看出了,總共7位。
它可以和0101-1111 或者是1101-1111,進(jìn)行And
在C#中And 是&
所以你可能會(huì)將函數(shù)修改為:
for (int i = 0; i < chars.Length; i++)
{
chars[i] = (char)(chars[i] & 11011111);
}
先停一下,你認(rèn)為上面的寫法正確嗎?
然后運(yùn)行,結(jié)果卻發(fā)現(xiàn):
為什么?
這是因?yàn)镃#中的& 默認(rèn)操作的是十進(jìn)制的數(shù)字,所以11011111,
就會(huì)變成一千一百零一萬(wàn)一千一百一十一
所以要將2進(jìn)制的11011111 變成10進(jìn)制,如何轉(zhuǎn)變?
int value = Convert.ToInt32("11011111", 2);
value的值是223.所以代碼修改為:
for (int i = 0; i < chars.Length; i++)
{
chars[i] = (char)(chars[i] & 223);
}
運(yùn)行可以得到正確的結(jié)果:
或者使用16進(jìn)制來(lái)表示:1101-1111 ,的16進(jìn)制是:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
0 1 2 3 4 5 6 7 8 9 A B C D E F
1101=2^3+2^2+1=8+4+1=13 = D
1111=2^3+2^2+2^1+2^0=8+4+2+1=15 = F
所以可以將上面的代碼修改為:
chars[i] = (char)(chars[i] & 0xdf);
同樣因?yàn)橹皇堑?位不同,而第7位會(huì)被忽略。所以和 0101-1111進(jìn)行and操作也可以得到正確的答案:
而0101-1111 的16進(jìn)制是0x5f.所以代碼可以變成:
chars[i] = (char)(chars[i] & 0x5f);